תוכן שנמחק תוכן שנוסף
Yehuz (שיחה | תרומות)
הצלת 1 מקורות והוספת 1 לארכיון.) #IABot (v2.0
שורה 22:
 
== הרחבות ==
הוצעה הרחבה של word2vec לבניית embedding ממסמכים שלמים (ולא ממילים בודדות). הרחבה זו נקראת paragraph2vec או doc2vec ויושמה בכלי C, Python{{הערה|שם=doc2vec_python|{{Cite web|title=Doc2Vec tutorial using Gensim|url=https://medium.com/@klintcho/doc2vec-tutorial-using-gensim-ab3ac03d3a1|accessdate=2015-08-02|display-authors=etal}}}}{{הערה|שם=doc2vec_imdb|{{Cite web|title=Doc2vec for IMDB sentiment analysis|url=https://github.com/piskvorky/gensim/blob/develop/docs/notebooks/doc2vec-IMDB.ipynb|accessdate=2016-02-18|display-authors=etal}}}} ו- Java / Scala{{הערה|שם=doc2vec_java|{{Cite web|title=Doc2Vec and Paragraph Vectors for Classification|url=http://deeplearning4j.org/doc2vec.html|accessdate=2016-01-13|display-authors=etal|archiveurl=https://web.archive.org/web/20151231073758/http://deeplearning4j.org/doc2vec.html|archivedate=2015-12-31|url-status=dead}}}} (ראה להלן), כאשר גרסאות ה- Java וה- Python תומכות גם בהקשר ל-embedding של מסמך על מסמכים חדשים שטרם נראו.
 
== וקטורי מילים לביואינפורמטיקה: BioVectors ==