“האנציקלופדיה של הרעיונות” הינה חיבור אנציקלופדי מקורי וביקורתי על תרבות, מחשבה ותקשורת בנות זמננו; מדריך תיאורטי ושימושי למסע בין תחומי דעת מרכזיים של חיי הרוח והיומיום, הכולל מאות ערכים על הרעיונות המעצבים את חיינו. האנציקלופדיה שנכתבה בידי ד"ר דוד גורביץ וד"ר דן ערב, יצאה לאור כספר בשנת 2012 בהוצאת בבל.
כדי להתאמן בפייתון, SQL ו-SNA, חשבתי שיהיה מגניב לנסות לנתח את הקישורים הפנימיים ב"אנציקלופדיה של הרעיונות" (http://haraayonot.com/). בדרך גיליתי מה הרעיונות המרכזיים והחשובים בעולם היום, ניתחתי קבוצות של רעיונות, ולמדתי כמה שיעורים.
התחלתי בלבנות סקרייפר. השתמשתי בספריית requests כדי לנהל את ה-http sessions ובספריית beautifulsoup בשביל הparsing. בשלב הראשון חילצתי את רשימת כל הערכים (http://haraayonot.com/alphabetic-ideas/), והסקרייפר עבר על כל ערך, מצא את שם הערך בעברית ובאנגלית, את ה-URL של הדף ונתן לכל דף מספר סידורי. את כל המידע הזה שמתי בטבלת nodes ב-sqlite. לאחר מכן הסקרייפר עבר ערך ערך והוציא את כל הלינקים מכל ערך, בדק את המס"ד שמקושר ללינק בטבלת ה-nodes, והכניס הכל לטבלת edges.
בסוף התהליך, ואחרי שניקיתי קצת את המידע (והסתבכתי קשות עם ה-encoding), יצאו 540 nodes, ו-12,125 edges. מרשים. פתחתי את הטבלאות ב-Gephi.
כדי להכין את הסקרייפר הייתי צריך לשוטט קצת באתר ולהבין איך הוא בנוי. הנחתי, שכיוון לחיבור קוראים "האנציקלופדיה של הרעיונות" כשאסיים לנתח אותו אדע מה הרעיונות החשובים ביותר בעולם. מה שהבנתי בדיעבד, זה שלפני הכל, צריך להבין את המידע שעובדים איתו. כלומר התברר לי כשעברתי על הערכים ובייחוד כשהערך עם הכי הרבה centrality היה פוסט-מודרניזם, שהאינציקלופדיה של הרעיונות זו כותרת מעט יומרנית למה שהוא בפועל "האנציקלופדיה של הרעיונות המערביים הפרוגרסיביים של מאה ה-21". לא תמצאו בו ערך על האידיאות של אפלטון או אפילו על הומניזם, אבל בהחלט ניתן למצוא בו ערכים כמו אינטרטקסטואליות וטכנוגותיקה.
אם כך, על פי הממצאים, ניתן לראות בבירור שעולם המחשבה שמציגה האנציקלופדיה מבוססת ברובה על החשיבה הפוסטמודרנית, ואכן זה הערך שקיבל את ה-degree, ה-centrality וה-betweenness הגבוהים ביותר (בעודו מפוצל למספר ערכים שונים(!)- פוסטמודרניזם באומנות, בפילוסופיה וכו'). ואיתו מושגים בהקשר דומה: אני/אחר, ייצוג, אובייקט/סובייקט, ועוד.
הנחת היסוד: כדי להבין כמה שיותר מושגים שקשורים לעולם המחשבה של ימינו, כדאי שנמצא את הערכים עם ה-betweenness הגבוה ביותר, כלומר אלה שהכי יעיל לעבור דרכם כשאנחנו עוברים בין ערכים שונים ברשת.
בראש הדירוג הזה עומד כמובן הפוסטמודרניזם, אחריו טלוויזיה, ואז מודרניזם (כנראה שצריך להבין רעיונות מודרניסטיים כדי להבין מה זה פוסטמודרניזם).
הנחת היסוד: כדי להבין את מושג כלשהו, צריך להבין את כל הערכים שמוזכרים בו. דמיינו שאתם קוראים ערך ופתאום מופיע מושג שאתם לא מכירים- הדבר ההגיוני לעשות הוא לקרוא את הערך שמסביר את המושג. כלומר, הערכים עם ה-In-Degree הגבוה ביותר הם הערכים שנדרש להבין אותם כדי להבין הכי הרבה רעיונות אחרים באינציקלופדיה. ה-TOP-5 בדירוג הזה הם קפיטליזם (171), פוסטמודרניזם (155), משמעות (148), אני/אחר (147), ואובייקט/סובייקט (142).
הופתעתי לגלות עד כמה הקהילות שנתן לי אלגוריתם Louvain היו מובהקות מבחינה נושאית. אחרי סריקה איכותנית של כל אחת מהקהילות, גיליתי שהמדד שהכי התאים לכותרות האיכותניות שנתתי לכל קהילה היה הdegree, כשהערכים עם ה-degree הגבוה ביותר בדרך כלל היו בעלי הדימיון הרב ביותר לכותרת האיכותנית שאני נתתי. להלן הקהילות ע"פ גודלן, בסדר יורד:
הקהילה הגדולה ביותר, פילוסופיה פוסטמודרנית ורעיונות נוספים
תרבות וטכנולוגיה
החיים בתרבות קפיטליסטית. תת הקהילה הירוקה עוסקת באורבניות ועיר, הכתומה בתנוכות נגד לקפיטליזם, הכחולה בקפיטליזם, גלובליזציה ונגזרותיהן המעשיות, והסגולה בתרבות הצריכה
אומנות מודרנית: תתי קהילות ירוקה וסגולה מורכבות מתנועות באומנות מודרנית ורעיונות בהקשר הזה, הכחולה בתרבות חזותית, והירוקה והמובהקת מכולם במוזיקה
ה"אני", זהות
הערך "אידיאולוגיה" הוא בעל הdegree והbetweenness הגבוהים ביותר, והוא המגדיר המובהק של הקהילה הזו. תתי קהילות התחלקו די יפה. תת הקהילה הסגולה מורכבת בבירור מאידיאולוגיות שקשורות למיעוטים, הדרתם מהחברה והרעיונות שעומדים מאחורי ההדרה או באים כביקורת עליה. הקהילה הירוקה נראית קשורה יותר לזהות ולהגדרה עצמית. הכחולה עוסקת בפילוסופיה מרקסיסטית על שלל רכיביה?, והקבוצה הכתומה היא יותר מטא-,בערכים בה עוסקים בפרקטיקות מטא-רעיוניות- כמו ביקורת, שיח ועוד.
לא החלטתי עדיין, אבל חשבתי שאפשר:
- לכרות את כל ההוגים המוזכרים בערכים השונים, ולנסות לאמוד את השפעתם, את תחומי החיים שעסקו בהם וכו'
- להפוך את המידע לגרף אינטראקטיבי עם D3, כך שתתאפשר אקספלורציה נוחה יותר של המידע
- לקחת את הערכים במקבילים בויקיפדיה ולעשות להם בדיקה דומה
תודה שקראתם! אשמח לשמוע הערות וללמוד מאנשים שמבינים בתחום באמת :)