pa ok, ali me baš zanimaju reči koje upotrebimo tek jednom godišnje
Kažu da nema glupih pitanja, samo odgovora, pa da pokušam da ti odgovorim. Uzmi rečnik srpskog jezika, ima da se skine. Onda na Guglu podesi da ti pretražuje sajtove na srpskom jeziku i prosto, počni redom od A do Š pa ćeš ustanoviti pojavnost reči. Imaš i lakši način
Frekvencijski rečnik - monumentalni projekat
BEOGRAD - JP "Službeni glasnik" danas je u Rektoratu Beogradskog univerziteta predstavio monumentalni projekat prof. Đorđa Kostića (1909-1995) u koji je ugrađeno 11 miliona reči da bi se stvorio jedinstveni rečnik srpskog jezika o učestalosti korišćenja određenih reči kroz period od 12. veka do savremenog doba.
RTV četvrtak, 3. jun 2010. | Tanjug
Pred naučnu javnost su izneta prva tri toma "Frekvencijskog rečnika - Kvantitativnog opisa strukture srpskog jezika" koji predstavljaju prvo kolo "Srpski jezik od XII do XVIII veka" i bave se rečnikom Domentijanovih dela.
O celom projektu, koji je započet 1957. godine, a trajaće još niz godina, govorili su urednik Biblioteke LEXIS Milojko Knežević, priređivač Rečnika dr Aleksandar Kostić i stručni recenzent prof. dr Đorđe Trifunović.
Direktor "Glasnika" Slobodan Gavrilović izrazio je zadovoljstvo što je ova izdavačka kuća preuzela realizaciju tako važnog projekta za srpsku kulturu koji smatra da je najveći izdavački poduhvat u istoriji "Glasnika".
On je konstatovao da su samo veliki sanjari poput Kostića u stanju da se poduhvate posla koji je obuhvatio 11 miliona reči i tako uvrstio Srbiju među velike kulture koje imaju Frekvencijske rečnike svog jezika kroz istoriju. On je napomenuo da će Glasnik objaviti ceo rečnik u digitalnoj formi.
Gavrlović se požalio da javnost nije dovoljno upoznata da ovim projektom na kome sarađuju sa Institutom za eksperimentalnu fonetiku i patologiju govora i Laboratorijom za eksperimentalnu psihologiju Filozofskog fakulteta BU.
Gavrilović je poklonio prva tri toma Rečnika rektoru BU prof. dr Branku Kovačeviću.
Govoreći o pionirskom radu prof. dr Kostića koji je osnovao Institut za eksperimentalnu fonetiku i patologiju govora, urednik edicije LEXIS Knežević je istakao da je on u okviru projekta mašinskog prevođenja i automatskog prepoznavanja teksta formirao ručno anotirani dijahroni korpus srpskog jezika, obima 11 miliona reči, od 12. veka do savremenog jezika.
Početkom 1996. godine, ručno obrađena građa prebačena je u elektronski oblik.
Napravljen je Frekvencijski rečnik savremenog srpskog jezika (sedam tomova) izveden iz dva poduzorka savremenog srpskog jezika (poetski tekstovi i dnevna štampa).
Pored frekvencije odrednica date su i frekvencije svakog gramatičkog oblika odrednica koje su su javile u uzorku (u toku je proširenje Rečnika dodavanjem uzorka literarne proze).
Upravo objavljeni Frekvencijski rečnik Domentijana, omogućava pretraživanje odrednica i izvornih tekstova. U prvom tomu dati su izvorni i gramatički obrađeni tekstovi oba Domentijanova žitija sa odrednicama i gramatičkom specifikacijom svake reči. U drugom tomu su frekvencijski rečnici žitija sv. Simeona i sv. Save. Oba žitija sadrže 78.284 reči, 4.606 odrednica i 15.783 gramatička oblika odrednica. Od 3.139 gramatičkih oblika sistema gramatičkog kodiranja srpskoslovenskog jezika, kod Domentijana se javljaju 972.
U obrađenom korpusu srpskog jezika poseban značaj, kako je naveo njegov priređivač Aleksandar Kostić ima segment od 12. do 18. veka (500.000 reči) koji, preciznom anotacijom gramatičkih oblika i analizom učestalosti svake reči, istraživačima znatno olakšava proučavanje najranijih faza razvoja srpskog jezika.
Ako te pak zanima koje se reči malo pojavljuju u hrvatskoj varijanti srpskog jezika, to ćeš još lakše saznati jer oni imaju frekvencijski ("čestotni") rečnik, mislim, čak i online. Javi ako ne nađeš.