שכיחות אותיות בעברית – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
מאין תקציר עריכה |
Matanyabot (שיחה | תרומות) מ בוט החלפות: \1וויקיפדיה, עברי |
||
שורה 3:
מידע על [[שכיחות אותיות| שכיחות האותיות]] שימושי לפענוח [[הצפנה|צפנים]] המבוססים על החלפת [[אות|אותיות]], מסייע ל[[מחקר]] [[בלשנות|בלשני]] וחיוני ב[[בלשנות חישובית]] וב[[עיבוד שפה טבעית]].
להלן שכיחות האותיות בשלושה מאגרי טקסט (קורפוסים) של עברית מודרנית, כ-40 מיליון אותיות בשניים הראשונים וכ<span title="507779597" >500</span> מיליון אותיות באחרון. הראשון הוא מאגר כתבות מעיתון הארץ מהשנים 1991-1990, השני מאגר פרוטוקולים של הכנסת משנת 2004 והשלישי הוא
[[קובץ:HebFreq.png|ממוזער|700px|[[שכיחות]] ה[[אלפבית עברי|אותיות בעברית]] ב[[אחוז]]ים, מהנדירות לנפוצות.]]
|