Hugging Face

חברה אמריקאית מענף למידת המכונה

Hugging Face היא חברה אמריקאית המפתחת כלים לבניית יישומים באמצעות למידת מכונה.[1] בין מוצרי הדגל של החברה בולטת ספריית הטרנספורמרים שלה שנבנתה עבור יישומי עיבוד שפה טבעית. בנוסף, לחברה פלטפורמה בשם Hugging Face Hub, המאפשרת למשתמשים לשתף מודלים ומערכי נתונים של למידת מכונה בקוד פתוח. על אף שמדובר בחברה פרטית, נכון ל-2023 אופי החברה דוגל בשיתופיות והנגשת מודלי שפה גדולים, הנחשבת לנחלתם של תאגידים טכנולוגיים, לכלל קהילת המפתחים.[2]

Hugging Face, Inc.
נתונים כלליים
סוג חברה פרטית
מייסדים קלמנט דלנג, ז'וליאן שאמון, תומס וולף
תקופת הפעילות 2016–הווה (כ־8 שנים)
חברות בנות Hugging Face SAS עריכת הנתון בוויקינתונים
מיקום המטה ניו יורק סיטי, ארצות הברית
מוצרים עיקריים Transformers, datasets, spaces, Hugging Face Hub
הכנסות 15,000,000 דולר אמריקאי (נכון ל־2022) עריכת הנתון בוויקינתונים
עובדים 170 (נכון ל־אוגוסט 2023) עריכת הנתון בוויקינתונים
 
huggingface.co
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

היסטוריה עריכה

החברה נוסדה ב-2016 על ידי היזמים הצרפתים קלמנט דלאנג, ז'וליאן שאמון ותומס וולף. מטרת החברה בעת היווסדה הייתה פיתוח אפליקציית צ'אטבוט המיועדת לבני נוער. [3] לאחר שהחברה פרסמה בקוד פתוח את המודל שעמד בבסיס הצ'אטבוט, החלה החברה לפנות לכיוון פיתוח פלטפורמה פתוחה למודלי למידת מכונה.

במרץ 2021 גייסה החברה 40 מיליון דולר בסבב גיוס B.[4]

ב-28 באפריל 2021, החברה השיקה את סדנת המחקר BigScience בשיתוף עם מספר קבוצות מחקר אחרות, במטרה לשחרר לקהילה מודל שפה גדול בקוד פתוח.[5] בשנת 2022 הסתיימה הסדנה בהכרזה על BLOOM, מודל שפה רב לשוני עם 176 מיליארד פרמטרים.[6]

ב-21 בדצמבר 2021, החברה הודיעה על רכישת Gradio, ספריית תוכנה המשמשת להדגמות דפדפן אינטראקטיביות של מודלים של למידת מכונה.[7]

ב-5 במאי 2022, החברה הודיעה על סבב גיוס נוסף, לפי שווי של 2 מיליארד דולר.[8]

ב-3 באוגוסט 2022, החברה הכריזה על Private Hub, גרסה פרטית עם ייעוד ארגוני של פלטפורמת המודלים הפתוחה Hugging Face Hub.[9]

בפברואר 2023, החברה הודיעה על שותפות עם Amazon Web Services ‏(AWS) שתאפשר ללקוחות AWS שימוש מותאם אישית במוצרים של Hugging Face. עוד הודיעה כי הדור הבא של מודל השפה BLOOM יופעל על Trainium, שבב למידת מכונה קנייני שנוצר על ידי AWS.[10][11]

באוגוסט 2023, הודיעה החברה כי גייסה 235 מיליון דולר, לפי שווי של 4.5 מיליארד דולר. המימון הובל על ידי Salesforce, בשיתוף ענקיות טכנולוגיה נוספות, בהן גוגל, אמזון, אנבידיה, AMD, אינטל, יבמ וקוואלקום.[12]

שירותים וטכנולוגיות עריכה

ספריית Transformers עריכה

ספריית Transformers היא חבילת פייתון המכילה יישומי קוד פתוח של מודלי טרנספורמר הנועדו לבצע משימות מתחום ניתוחי הטקסט, התמונה והאודיו. הספרייה מותאמת לפרויקטים המשתמשים בספריות הלמידה העמוקה הפופולריות ביותר PyTorch, TensorFlow ו- JAX, ומוטמעים בה מודלי שפה בולטים דוגמת BERT ו- GPT-2.[13]

הספרייה מסוגלת לבצע משימות ספציפיות מתחום למידת המכונה. כך למשל, על מנת לבצע ניתוח סנטימנט (זיהוי האם הרגש הנובע מטקסט הוא חיובי או שלילי), ניתן להשתמש בספריה כך:

from transformers import pipeline
sentiment_pipeline = pipeline("sentiment-analysis")
data = ["I love you", "I hate you"]
sentiment_pipeline(data)

כאשר התוצאה במקרה זה תהיה:

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]

בנוסף לביצוע משימות ייעודיות, הספריה כוללת גם כלי עזר לאימון מודלים. בהם, למשל, Tokenizer, הממירה טקסט לייצוג וקטוריאלי של ספרות (שלב נדרש באימון מודלי שפה).

Hugging Face Hub עריכה

Hugging Face Hub היא פלטפורמה (שירות אינטרנט מרכזי) לאירוח:[14]

  • מאגרי קוד מבוססי גיט, וכוללת תכונות המזכירות את גיטהאב, אך עם אוריינטציה המכוונת לתחום למידת המכונה.
  • מודלים של למידת מכונה. בפלטפורמה קיימים מודלים שנבנו על ידי משתמשים אינדיבידואלים, ועד תאגידי ענק כמו גוגל, מטא, ואף מדינות דוגמת איחוד האמירויות הערביות.[15]
  • מערכי נתונים, בעיקר בטקסט, תמונות ואודיו;
  • יישומי אינטרנט המיועדים להדגמות בקנה מידה קטן של יישומי למידת מכונה.

Hugging Chat עריכה

לחברה צ'אטבוט מקוון בשם Hugging Chat,[16] המבוסס על מודל שפה גדול בקוד פתוח, אשר ניתן לשוחח עמו בדומה ל-ChatGPT. נכון ליולי 2023, הצ'אטבוט מבוסס על מודל LLaMA-2 של חברת מטא.[17]

ספריות נוספות עריכה

בנוסף לשתי הספריות האמורות, Hugging Face כוללת ספריות פייתון למשימות נוספות, כגון datasets לעיבוד נתונים, Evaluate להערכת מודלים, Simulate להרצת סימולציות ועוד.[18]

קישורים חיצוניים עריכה

  מדיה וקבצים בנושא Hugging Face בוויקישיתוף

הערות שוליים עריכה

  1. ^ "Hugging Face – The AI community building the future". huggingface.co. נבדק ב-2022-08-20.
  2. ^ Hugging Face takes step toward democratizing AI and ML, VentureBeat, ‏2022-09-27 (באנגלית אמריקאית)
  3. ^ "Hugging Face wants to become your artificial BFF". TechCrunch (באנגלית אמריקאית). 9 במרץ 2017. נבדק ב-2022-08-20. {{cite web}}: (עזרה)
  4. ^ "Hugging Face raises $40 million for its natural language processing library". 11 במרץ 2021. {{cite web}}: (עזרה)
  5. ^ "Inside BigScience, the quest to build a powerful open language model". 10 בינואר 2022. {{cite web}}: (עזרה)
  6. ^ "BLOOM". bigscience.huggingface.co. נבדק ב-2022-08-20.
  7. ^ "Gradio is joining Hugging Face!". huggingface.co. נבדק ב-2022-08-20.
  8. ^ Cai, Kenrick. "The $2 Billion Emoji: Hugging Face Wants To Be Launchpad For A Machine Learning Revolution". Forbes (באנגלית). נבדק ב-2022-08-20.
  9. ^ "Introducing the Private Hub: A New Way to Build With Machine Learning". huggingface.co. נבדק ב-2022-08-20.
  10. ^ Bass, Dina (2023-02-21). "Amazon's Cloud Unit Partners With Startup Hugging Face as AI Deals Heat Up". Bloomberg News.
  11. ^ Nellis, Stephen (2023-02-21). "Amazon Web Services pairs with Hugging Face to target AI developers". Reuters.
  12. ^ Leswing, Kif (2023-08-24). "Google, Amazon, Nvidia and other tech giants invest in AI startup Hugging Face, sending its valuation to $4.5 billion". CNBC (באנגלית). נבדק ב-2023-08-24.
  13. ^ "🤗 Transformers". huggingface.co. נבדק ב-2022-08-20.
  14. ^ "Hugging Face Hub documentation". huggingface.co. נבדק ב-2022-08-20.
  15. ^ Barrington, Lisa (2023-05-25). "Abu Dhabi makes its Falcon 40B AI model open source". Reuters (באנגלית). נבדק ב-2023-06-03.
  16. ^ HuggingChat, huggingface.co (באנגלית)
  17. ^ Get Hands-On With Meta's New Llama 2 Chat, Maginative, ‏2023-07-18 (באנגלית)
  18. ^ "Hugging Face - Documentation". huggingface.co. נבדק ב-2023-02-18.