logo  polski español français english
Skróty Statystyki Bibliografia Linki Nota prawna Redakcja/Kontakt

słowo lub początek (bez * ? % etc.) pokazuj wyniki w: pokazuj:
wyników na stronę
Korpusy jednojęzyczne

http://korpus.pwn.pl [ ]

Wydawnictwo Naukowe PWN przygotowało i udostępniło sieciową wersję Korpusu Języka Polskiego PWN wielkości 40 milionów słów. Korpus składa się z fragmentów 386 różnych książek, 977 numerów 185 różnych gazet i czasopism, 84 nagranych rozmów, 207 stron internetowych oraz kilkuset ulotek reklamowych. Pełna wersja sieciowa korpusu jest dostępna odpłatnie, a bezpłatnie wersja demonstracyjna wielkości ponad 7,5 miliona słów.

http://www.euskaracorpusa.net [ ]

Obszerny i dobrze opracowany korpus pisanego języka baskijskiego. Jest to wspólne przedsięwzięcie UZEI i Euskaltzaindii. Narzędzie umożliwia szukanie słów z uwzględnieniem kilku podstawowych kryteriów: dialekt, data powstania tekstu oraz jego rodzaj (poezja, literatura piękna, teksty kościelne etc.). Ponadto wyposażony w możliwość wyświetlenia wykresów statystycznych z podziałem na wspomniane kryteria. Istnieją dwa rodzaje wyszukiwania: proste oraz złożone. Poszukiwane słowo jest dla ułatwienia wyróżnione kolorem, istnieje też możliwość przejrzenia większej części znalezionego tekstu oraz podstawowych informacji na jego temat (autor, tytuł, data powstania).

http://www.corpeus.org [ ]

CorpEus pozwala na korzystanie z sieci jako wielkiego rozproszonego korpusu języka baskijskiego. Wyszukiwanie jest zlematyzowane (dotyczy tylko stron w baskijskim), a warianty językowe zaznaczone. Wyniki wyświetlane są w kontekście. Użytkownik posiada także możliwość stosowania filtrów językowych, wybór licznych formatów tekstowych, równoległe pobieranie plików, bieżące tworzenie indeksu KWIC z uwzględnieniem kryteriów wyszukiwania, lematyczna analiza wyników oraz pod względem części mowy, zliczanie występowań oraz wykresy.

http://www.ztcorpusa.net [ ]

Zientzia eta Teknologiaren Corpusa jest korpusem języka baskijskiego zawierającym słownictwo z zakresu nauki i technologii. Umożliwia szukanie po lemmach albo po formach wyrazowych. Dodatkowo można zawęzić szukanie do jednej z 12 dostępnych kategorii (części mowy). Korpus ten zawiera artykuły i biblioteki popularno-naukowe, naukowe, dokumenty administracji publicznej i in. Pełny opis możliwości korpusu (w języku baskijskim) znajduje się http://www.ztcorpusa.net/aurkezpena.htm. Szukane wyrazy ukazane są w kontekście oraz dla ułatwienia podświetlone. Dodatkowo wyniki ukazane są w formie wykresu.

http://korpus.pl/ [ ]

Korpus IPI PAN jest dużym (obecnie ponad 250 mln segmentów), anotowanym morfosyntaktycznie, publicznie dostępnym korpusem języka polskiego, stworzonym przez Zespół Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN (IPI PAN), w ramach projektów Komitetu Badań Naukowych oraz w ramach badań statutowych IPI PAN. Teksty wchodzące w skład Korpusu IPI PAN są dostępne w postaci binarnej, umożliwiającej łatwe i efektywne przeszukiwanie za pomocą dedykowanego oprogramowania o nazwie Poliqarp. Poliqarp dostępny jest zarówno przez wyszukiwarkę internetową, jak i jako odrębny program dla systemów operacyjnych GNU/Linux i Windows. Od marca 2006 źródła Poliqarpa dostępne są na licencji GPL.

http://www.natcorp.ox.ac.uk/ [ ]

The British National Corpus jest 100 milionowym zbiorem słów zaczerpniętych z próbek języka pisanego i mówionego pochodzących z rozmaitych źródeł dobranych tak, aby w pełni ukazać przekrój współczesnego języka angielskiego.

http://www.mimuw.edu.pl/polszczyzna/pl196x/index.htm [ ]

Niniejsza witryna poświęcona jest korpusowi słownika frekwencyjnego polszczyzny współczesnej — zestawowi tekstów zebranych w latach 1963-1967 na potrzeby badań nad częstością występowania wyrazów w języku polskim. Składa się na nie 10 000 próbek po około 50 słów każda, czyli ogółem ok. 500 000 słów z tekstów współczesnego języka pisanego, zgromadzonych w pięciu transzach odpowiadających najważniejszym stylom polszczyzny pisanej. Wyniki dla poszczególnych stylów zostały w latach 1974-77 udostępnione w postaci list frekwencyjnych, natomiast w roku 1990 ukazał się słownik frekwencyjny polszczyzny współczesnej w postaci tomu zbiorczego. W roku 2001 autorzy wyrazili zgodę na udostępnienie korpusu na zasadach licencji GNU i umieszczenie go w Internecie. Niniejsza strona poświęcona jest prezentacji danych korpusowych w wersji podstawowej i rozszerzonej (wzbogaconej) oraz związanych z nimi dodatkowych materiałów i dokumentacji korpusu.

http://www.titania.bham.ac.uk/ [ ]

Bieżąca wersja Banku Języka Angielskiego dostępna dla programu LookUp zawiera 450 milionów słów. Dane pochodzą z korpusu Banku Języka Angielskiego (zarządzanego przez HarperCollins Publishers oraz Uniwersytet w Birmingham).

http://www.corpusdelespanol.org/ [ ]

Korpus języka hiszpańskiego jest rozwijany przez profesora Marka Daviesa z Uniwersytetu Stanowego Illinois. Korpus zawiera ponad 100 milionów słów. W jego skład wchodzi kolekcja ponad 10.000 tekstów pochodzących z okresu XIII-XX wiek. Projekt umożliwia wyszukiwanie synonimów dla ponad 30.000 słów, wyszukiwanie kolokacji, frekwencji, według części mowy.

http://corpus.rae.es/cordenet.html [ ]

Korpus diachroniczny języka hiszpańskiego stworzony przez RAE.

http://corpus.rae.es/creanet.html [ ]

Korpus współczesnego języka hiszpańskiego, stworzony przez RAE, zawiera ponad 200 milionów słów.

Korpusy dwu- i wielojęzyczne

http://www1.euskadi.net/euskalterm/indice_e.htm [ ]

EUSKALTERM jest Publicznym Bankiem Terminologii Języka Baskijskiego, zarządzanym i udostępnianym przez Rząd Kraju Basków. Pierwotnym autorem projektu było UZEI (Baskijskie Centrum Terminologii i Leksykografii). EUSKALTERM zawiera słownictwo i terminologie opracowane przez UZEI oraz kontrybucje innych jednostek. Obecnie zawiera około 100.000 terminów oraz ich ekwiwalentów hiszpańskich, francuskich, angielskich oraz łacińskich (taksonomia). Terminy są ciągle aktualizowane zgodnie z normami Euskaltzaindii oraz propozycjami normalizacji.

Narzędzia

http://www.cs.put.poznan.pl/dweiss/xml/projects/lametyzator/index.xml?lang=pl [ ]

Lametyzator jest prostym, aczkolwiek jedynym ogólnie dostępnym, programem do zamiany słów języka polskiego z formy odmienionej na podstawową. Potrzeba takiego programu jest wręcz olbrzymia - wykorzystuje się je przede wszystkim przy komputerowym przetwarzaniu tekstów, przy odkrywaniu wiedzy z danych i w ogólności w lingwistyce komputerowej.

http://www.cnrtl.fr/lexiques/morphalou/ [ ]

Morphalou jest obszernym leksykonem morfologicznym języka francuskiego w formacie XML. Bazowany jest na standardzie ISO (TC37/SC4) Struktury Znaczników Leksykalnych (Lexical Markup Framework) - wysokopoziomowym modelu przedstawiania danych zasobów leksykalnych - i w ten sposób gwarantuje optymalną współpracę z wielojęzykowymi aplikacjami komputerowymi. Z językoznawczego punktu widzenia, spójność i poprawność danych są zagwarantowane przez komitet redakcyjny ATILF (Analiza i Komputerowe Przetwarzanie Języka Francuskiego). ATILF zajmuje się również utrzymaniem i aktualizacją leksykonu. Morphalou jest ogólnie dostępny bezpłatnie do celów edukacyjnych oraz na potrzeby naukowe. Morphalou został utworzony na bazie TLFnome, czyli "Skarbnicy Języka francuskiego" (Trésor de la Langue Française), która dostarczyła 539.413 form pochodzących od 68.075 lemmów. Transfer danych polegał na reorganizacji strukturalnej danych i normalizacji etykiet gramatycznych, jednakże nie doszło do żadnych strat danych.

http://www.gedlc.ulpgc.es/investigacion/scogeme02/lematiza.htm [ ]

Powyższe narzędzie językowe lematyzuje dowolne słowo hiszpańskie. Potrafi zidentyfikować jego formę kanoniczną, kategorię gramatyczną a także typ derywacji lub odmiany podanej formy wyrazu. Aplikacja potrafi również uzyskać formy pochodne na podstawie formy podstawowej oraz określonej przez użytkownika derywacji lub odmiany.

http://www.interneteuskadi.org/euskalbar/ [ ]

Plugin do Firefoxa ułatwiąjący wyszukiwanie słów w baskijskich słownikach i korpusach.

http://www.computing.surrey.ac.uk/SystemQ/align [ ]

Online'owe narzędzie do urównoleglania tekstów - umożliwia pocięcie niewielkich tekstów (do 20 kb) w językach: hiszpańskim, francuskim, angielskim i niemieckim na odpowiadające sobie, mniejsze fragmenty.

Biblioteki cyfrowe

http://www.klasikoak.com [ ]

Biblioteka cyfrowa zawierająca baskijskie tłumaczenia najważniejszych światowych dzieł z dziedziny ekonomii, filozofii, socjologii i polityki.

http://www.euskadi.net/LiburutegiDigitala [ ]

BDV (Cyfrowa Biblioteka Baskijska) jest owocem zgody między Departamentem Kultury Rządu Baskijskiego oraz Fundacją Sancho el Sabio będącą częścią Dzieła Pomocy Społecznej banku Caja Vital Kutxa (Obra Social de Caja Vital Kutxa). Celem biblioteki jest zachowanie i udostępnienie dziedzictwa bibliograficznego i dokumentalnego narodu baskijskiego. Zawiera prawie 4000 tytułów i blisko milion obrazów w formacie JPEG. Materiały te pochodzą ze zbiorów Fundacji Sancho el Sabio i dotyczą okresu od XV aż do początków XX wieku. W skład bibiloteki wchodzą również uchwały Parlamentu baskijskiego w formie cyfrowej.

http://gallica.bnf.fr/ [ ]

Gallica jest udostępnionym nieodpłatnie przez BnF (Francuską Bibliotekę Narodową) zbiorem ponad 90 000 dokumentów drukowanych (książek, czasopism, gazet i partytur), obrazów (rycin, map i fotografii) oraz nagrań pochodzących ze zbiorów BnF.

http://www.cfnavarra.es/BINADI/Ventanas/Entrada.aspx [ ]

Biblioteka cyfrowa Nawarry, zawiera ciekawe dokumenty - druki i manuskrypty - związane z tą prowincją, m.in. zbiory praw, kroniki.

http://www.bizkaia.net/kultura/foru_liburutegia/bibdigital_spi.asp?Idioma=EU&Tem_Codigo=2542 [ ]

Na zasoby tej biblioteki cyfrowej składają się stopniowo skanowane dzieła XVI, XVII i XVIII-wieczne z Biblioteki Biskajskiej oraz 38 inkunabułów sprzed roku 1501. Najstarszym rękopisem jest inkunabuł Johannesa Gersona z roku 1472. Większość dzieł z kolekcji to książki baskijskie, łacińskie i hiszpańskie.

http://www.bne.es/BDH/index.htm [ ]

Biblioteca Digital Hispánica pozwala na przeglądanie i pobieranie około 10 000 dzieł: manuskryptów, książek z XV-XIX wieku, nagrań, rysunków, plakatów, fotografii i map ze zbiorów Hiszpańskiej Bibliotek Narodowej.

http://www.ucm.es/BUCM/atencion/5761.php [ ]

Biblioteka cyfrowa Universidad Complutense de Madrid zawiera około 81 000 dokumentów w wolnym dostępie, w tym artykuły naukowe, dawne książki i nagrania oraz prace doktorskie obronione na tym uniwersytecie.

http://www.sbc.org.pl/dlibra [ ]

Śląska Biblioteka Cyfrowa umożliwia szeroki dostęp do zabytków piśmiennictwa, prac naukowych, materiałów dydaktycznych i regionalnych przechowywanych na terenie historycznego Śląska oraz województwa śląskiego.

http://hedatuz.euskomedia.org [ ]

http://www.theeuropeanlibrary.org/portal/ [ ]

"The European Library" (Biblioteka Europejska) oferuje na swojej stronie dostęp do zbiorów cyfrowych i katalogów 47 europejskich bibliotek narodowych.

http://monika.univ.gda.pl/~literat/books.htm#books [ ]

Wirtualna biblioteka literatury polskiej stworzona na Uniwersytecie Gdańskim

Katalogi

http://www.linguanet-europa.org/plus/welcome.htm [ ]

Lingu@net Europa to wirtualne centrum gromadzące wielojęzyczne zasoby online. Jego celem jest wspieranie procesu nauki języków obcych. Zawiera linki i informacje na temat wysokiej jakości zasobów online związanych z nauką języków obcych. Zgromadzone tu zasoby pochodzą z całego świata.

http://www.ilovelanguages.com/ [ ]

iLoveLanguages jest obszernym katalogiem internetowych źródeł językowych i językoznawczych. Każdy z ponad 2400 linków na iLoveLanguages został osobiście zweryfikowany, aby zapewnić najlepsze linki językowe z całej sieci. Niezależnie od tego, czy szukasz internetowych lekcji, słowników, narzędzi i usług tłumaczeniowych, literatury w wersji oryginalnej, oprogramowania, szkół językowych, czy też po prostu jakichkolwiek informacji na temat języka, o którym usłyszałeś, iLoveLanguages prawdopodobnie ma coś dla Ciebie, co w jakiś sposób będzie pasowało do Twoich potrzeb.

http://hiztegia.net/ [ ]

Wykaz linków do baskijskich słowników, encyklopedii, korpusów i innych narzędzi lingwistycznych.

http://databases.unesco.org/xtrans/xtra-form.shtml [ ]

Index Translationum jest wykazem tłumaczeń przygotowanym przez UNESCO. Baza danych zawiera informacje bibliograficzne książek przetłumaczonych i wydanych od 1979 roku w ok. setce krajów członkowskich UNESCO i obejmuje jak dotąd ponad 1 700 000 pozycji z takich dyscyplin jak literatura, nauki społeczne i humanistyczne, nauki ścisłe i przyrodnicze, sztuka, historia etc. Nie obejmuje czasopism, artykułów prasowych, patentów ani broszur. Baza uaktualniana jest co 4 miesiące.

http://www.sfb441.uni-tuebingen.de/c1/corpora.html#Deutsch [ ]

Zbiór odnośników do korpusów lingwistycznych opracowany przez Centrum Badawcze SFB 441 z Uniwersytetu w Tübingen.

Inne

http://ldc.upenn.edu [ ]

LDC (Konsorcjum Danych Lingwistycznych) wspiera edukację językową, badania i rozwój technologii poprzez tworzenie i udostępnianie materiałów lingwistycznych: dane, narzędzia i standardy.

http://www.wordcount.org [ ]

WordCount™ jest eksperymentem artystycznym dotyczącym sposobu, w jaki używamy języka. Zawiera 86.800 najczęściej występujących w języku angielskim słów, uporządkowanych według ich stopnia powszedniości. Pozycja każdego słowa została zeskalowana w stosunku do częstotliwości słów poprzedzających jak i następujących po danym wpisie. W ten sposób powstał swoisty barometr odpowiedniości. Im częściej używane jest jakieś słowo, tym większe jest. I na odwrót - im mniejsze słowo, oznacza to, że jest używane znacznie rzadziej i jest mniej powszednie. Dane WordCount™ pochodzą z British National Corpus® (Brytyjski Korpus Narodowy), zbioru 100 milionów słów będących próbkami pisanego i mówionego języka pochodzącymi z różnych źródeł. Ich celem jest przedstawienie dokładnego przekroju użycia współczesnego języka angielskiego. WordCount™ zawiera wszystkie słowa, które występują przynajmniej dwukrotnie w BNC®. W przyszłości WordCount™ będzie modyfikowany, aby śledzić stosowanie słów w obrębie danego tekstu, strony internetowej a docelowo, wcałym internecie.

http://iate.europa.eu [ ]

IATE (Inter-Active Terminology for Europe) to wielojęzyczna baza terminologiczna UE. W IATE można znaleźć specjalistyczną terminologię i żargon z zakresu UE, jak również słownictwo z całego szeregu dziedzin, jak prawo, rolnictwo, informatyka i wiele innych. IATE zawiera 8,4 miliona terminów, w tym około 540 000 skrótów i 130 000 zwrotów, i obejmuje wszystkie 23 języki urzędowe UE. Codziennie dodawane są nowe terminy, a zasoby są regularnie aktualizowane.

http://www.basqueresearch.com [ ]

Portal poświęcony badaniom naukowym i rozwojowi technologicznemu w Kraju Basków, z artykułami, wywiadami, zbiorem adresów m.in. przedsiębiorstw baskijskich i odnośnikami do ciekawych stron.

http://blogoscoped.com/text-color/ [ ]

Tagger popularności słów opracowany przez Google Blogoscoped.

http://wordle.net/ [ ]

http://www.ametza.com/bbk/htdocs/hasiera.htm [ ]

Powstała dzięki fundacji BBK (Bilbao Bizkaia Kutxa) wersja on-line książki Gotzona Garate zawierającej 14 458 przysłów baskijskich z ich odpowiednikami po hiszpańsku, angielsku i łacinie, a także 5 208 przysłów hiszpańskich, 4 045 angielskich i 3 462 łacińskich (także z odpowiednikami).

http://www.argia.com/mantxut/lokuzioak.htm [ ]

Na stronie znajdziemy (w rubryce Erramoldeak) zilustrowane zabawnymi rysunkami przysłowia i wyrażenia baskijskie, użyte w zdaniach, a także ich odpowiedniki po kastylijsku, francusku i angielsku.

Organizacje

http://ixa.si.ehu.es/Ixa [ ]

Grupa IXA została powołana do życia w celu promocji modernizacji języka baskijskiego poprzez rozwijanie podstawowych materiałów obliczeniowych. Wynikiem jej pracy są cztery aplikacje dostępne obecnie dla szerszej publiczności: narzędzie sprawdzania pisowni, pająk internetowy oraz słownik dwujęzyczny z możliwością lemmatyzacji, a także generator raportów pogodowych.

http://www.euralex.org [ ]

EURALEX (Europejskie Stowarzyszenie Leksykografii) jest międzynarodowym stowarzyszeniem naukowym założonym w 1983 roku. Za cel obrało promocję wszystkich aspektów leksykografii (opracowanie słowników) oraz leksykologii (studia nad słownikami oraz słownictwem). EURALEX jest swoistą platformą wymiany idei i informacji między jego członkami. Stowarzyszenie interesuje się słownikami każdego typu: jednojęzyczne, dwujęzyczne i wielojęzyczne, słowniki ogólne lub słownictwa specjalistycznego, drukowane lub elektroniczne. Podczas kongresów EURALEX poruszane są różne tematy: począwszy od historii leksykografii, aż do praktyki kompilacji słowników, poprzez terminologię, używanie słowników w nauce języków obcych, leksykografię korpusową lub komputerową (słowniki elektroniczne wykorzystywane w tłumaczeniach lub obróbce dokumentów).

http://www.uzei.com [ ]

Oficjalna strona organizacji UZEI - Baskijskiego Centrum Terminologii i Leksykografii, które stawia sobie za zadanie badanie i rozwój języka baskijskiego.

http://www.eaft-aet.net/ [ ]

http://www.elra.info/ [ ]