שכיחות אותיות בעברית – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
מאין תקציר עריכה |
עיצוב - הקטנת תמונה, כך שתופיע לצד הטבלה וויקיזציה של קישור חיצוני. |
||
שורה 5:
להלן שכיחות אותיות בשני מאגרי טקסט (קורפוסים) של עברית מודרנית, כ-40 מיליון אותיות בכל אחד. הראשון הוא מאגר כתבות מעיתון [[הארץ]] מהשנים 1991-1990, והשני מאגר [[פרוטוקול]]ים של [[הכנסת]] משנת 2004. המאגר נלקחו מ"מילה - מרכז ידע לתקשוב בשפה העברית" [http://www.mila.cs.technion.ac.il].
[[קובץ:HebFreq2.png
{| class="wikitable sortable"
! האות || שכיחות (חדשות) || שכיחות (כנסת)
שורה 73 ⟵ 71:
==ראו גם==
* [[ניתוח תדירויות]]
* [[חוק זיף]]
==קישורים חיצוניים==
* [http://www.tapuz.co.il/blog/ViewEntry.asp?EntryId=1638662
|