أربعةُ أسطرٍ نظَّمت الإنترنت

تصوّر الإنترنت عام 1998. لا تلك التجربة المصقولة المُنمّقة التي تعرفها اليوم، والتي تسوقك فيها الخوارزميات سَوقَ الإبل إلى مواردها — بل بَرِّيّةٌ. متاهةٌ مترامية الأطراف، نصفُها أعرج ونصفُها أعمى، زُهاءَ مليونين وأربعمئة ألف موقع تتكاثر بسرعةٍ تفوق طاقة أيّ فهرسةٍ بشرية¹. أتريد أن تبحث عن شيء؟ هنيئاً لك بالعذاب. تكتب استعلامك في AltaVista أو Lycos أو Excite، فيُقذف إليك — في أغلب الأحايين — ركامٌ من اللاصلة: رسائل مزعجة، وروابط ميتة، وصفحات حشاها أصحابها بكلمات مفتاحية خفيّة يتحايلون بها على النظام. لقد صارت الشابكة مكتبةً بلا أمين، أُلقيت كتبها على الأرض جملةً واحدة، ثمّ أُطفئت الأنوار.

كانت محرّكات البحث حينذاك تعمل بمبدأ يبدو — بأثر رجعي — ساذجًا إلى حدّ الغرابة: تعدّ كم مرةً ظهر مصطلح بحثك في الصفحة². أكثرُ ذكرٍ لكلمة «جاكوار»؟ وهذا كمن يحكم على عالِمٍ بمقدار ما يصرخ بأطروحته في غرفة مزدحمة. فالصوت العالي ليس سلطةً، والتكرار ليس حقيقة. وأهل الاحتيال كانوا يعرفون هذا — فيحشون نصوصاً خفيّة في صفحاتهم، يكرّرون الكلمات المفتاحية مئات المرات. كان النظام مكسوراً من جذره.

فإذا بطالبَي دكتوراه في ستانفورد ينظران إلى هذه الفوضى فيريان ما لم يرَهُ أحدٌ قبلهما. ليست مشكلةَ نصوص، وليست مشكلةَ كلمات مفتاحية، إنّها مشكلةٌ بِنيويّة.

2. البصيرة التي قلبت الموازين

لاري بيج وسيرغي برين –مؤسسا غوغل– لم يسألا: «ماذا تقول هذه الصفحة؟» بل سألا سؤالاً أبلغَ وأعمق بكثير: «ماذا يقول بقيّة الإنترنت عن هذه الصفحة؟»³

قِفْ عند هذه اللحظة وتأمّل. إنّها انقلابٌ كوبرنيكيّ. فبدلاً من تفحّص الصفحة بمعزلٍ عن غيرها — كأنّها جزيرة نائية من النصّ — فحصا علاقاتها. مَن يشير إليها؟ كم موقعاً يحيل إليها؟ والأهمّ: ما مقدار أهمّية تلك المواقع ذاتها؟

التشبيه الذي استخدمه بيج نفسه كان الاستشهاد الأكاديمي⁴. في الأكاديميا، لا تكتسب الورقة البحثية أهمّيتها لأنّها تدّعي أنّها مهمّة. تكتسبها لأنّ أوراقاً مهمّة أخرى تستشهد بها. إحالةٌ من بحثٍ رائد في Nature تحمل من الثقل ما لا تحمله إشارةٌ عابرة في نشرة قسمٍ مغمور. القيمةُ تراجعيّة، والسلطةُ تتسرّب وتنتشر، وهذا ليس مجرّد تشبيه — إنّه البنية الرياضية بعينها التي صاغاها.

«أهمّية صفحة الويب مفهومٌ تراجعيّ بطبيعته: الصفحة مهمّة إذا أشارت إليها صفحاتٌ مهمّة أخرى.»

— برين وبيج، «تشريح محرّك بحث نصّي تشعّبي واسع النطاق»، 1998³

هذه البصيرة الواحدة — أنّ الشابكة ليست مجموعة وثائق بل بيانٌ من العلاقات — هي ما جعل غوغل ممكنا. والآلة الرياضية التي نشراها لصياغة هذا المفهوم بالغةُ الحُسن إلى حدٍّ يأخذ بالألباب.

3. الرياضيات: جولةٌ عشوائية عبر الشابكة

ههنا يبدأ الجمال. انسَ الخوارزميات لحظة. تخيّل شخصًا — لِنُسمِّها المتصفّحة العشوائية — تبدأ من أيّ صفحة ويب وتضغط... تختار رابطًا عشوائيًّا في الصفحة وتتبعه، ثمّ آخر، ثمّ آخر، تفعل هذا إلى الأبد، مسيرةٌ لا نهائية عبر بنية الروابط التشعّبية في الشابكة⁵.

السؤال الذي يجيب عنه PageRank هو: على المدى البعيد، أيُّ نسبةٍ من الوقت تقضيها المتصفّحة العشوائية في كلّ صفحة؟ الصفحات التي ينتهي بها المطاف إليها أكثر هي — بحكم التعريف — الأكثر «أهمّية». إنّها الصفحات التي تصبّ بنية الشابكة ذاتها الانتباهَ نحوها.

البنية الصورية

رياضياً، تُنمذَج الشابكة كبيانٍ موجَّه G = (V, E)، حيث V مجموعة جميع صفحات الويب وE مجموعة الروابط التشعّبية بينها. نبني مصفوفة انتقال M، حيث كلّ مُدخَل Mᵢⱼ يمثّل احتمال الانتقال من الصفحة j إلى الصفحة i. فإذا كانت الصفحة j تملك L(j) من الروابط الخارجية، وأحدها يشير إلى الصفحة i، فإنّ Mᵢⱼ = 1/L(j). وإلّا فإنّ Mᵢⱼ = 0⁵.

غير أنّ ثمّة إشكالًا. ماذا يحدث حين تصطدم المتصفّحة العشوائية بطريقٍ مسدود — صفحة بلا روابط خارجية؟ تعلق. وماذا عن عناقيد الصفحات المنفصلة؟ لن تبلغها أبدًا. البنية الخام للروابط في الشابكة لا تشكّل كائنًا رياضيًا مُحكمًا حسنَ السلوك.

هنا أدخل برين وبيج معامل التخميد، ويُرمز له عادةً بـ α ويُحدَّد عند 0.85³. في كلّ خطوة، أمام المتصفّحة العشوائية خياران: باحتمال α تتبع رابطاً عشوائياً في الصفحة الحالية، وباحتمال (1 - α) تملّها الصفحة فتهجر المسار بالكلّية وتنتقل «انتقالاً آنياً» إلى صفحة عشوائية تماماً في أيّ مكان على الشابكة.

يُعرَّف متّجه PageRank — ولنرمز له بـ PR — بوصفه حلّاً للمعادلة:

PR = α · M · PR + (1 - α) · (1/N) · 1 ... (١)

حيث N العدد الكلّي للصفحات و1 متّجه الآحاد⁵. هذه منظومة خطّية. والأدقّ أنّ PR هو المتّجه الذاتي المهيمن للمصفوفة الانتقالية المعدَّلة

αM + (1 - α)(1/N)·1·1ᵀ.

ومبرهنة بيرون-فروبينيوس تضمن أنّ هذا المتّجه الذاتي موجود، ووحيد، وجميع مُدخَلاته موجبة — لأنّ حيلة الانتقال الآني تكفل أن تكون المصفوفة غير قابلة للاختزال (كلّ صفحة تستطيع بلوغ كلّ أخرى) ولا دورية (لا مصائد حلقية)⁶.

دعني أعيد القول بعبارة صريحة: ترتيب الشابكة العالمية بأسرها يُختزَل في إيجاد المتّجه الذاتي الرئيسي لمصفوفة هائلة الحجم شديدة التبعثر. هذا كلّ ما في الأمر. مليارات الصفحات، تريليونات الروابط، والجواب متّجهٌ ذاتي. فإن لم تقشعرّ لهذا الأبدان، فواللهِ ما أدري أيّ شيءٍ يقشعرّها.

التكرار بالقوة

عمليًّا، لا تُحلّ هذه المنظومة مباشرةً — فالمصفوفة أضخم من أن تُقتحم هكذا. بل يُستخدم التكرار بالقوة: تبدأ بتوزيع منتظم (كلّ صفحة متساوية الاحتمال)، تضرب في مصفوفة الانتقال، وتكرّر. كلّ دورةٍ تصقل التقدير. والجميل أنّ التقارب هندسيّ، تحكمه نسبة ثاني أكبر قيمة ذاتية إلى الأولى، وهي نسبة يُبقيها معامل التخميد دون الواحد بمسافةٍ مريحة⁷. في التنفيذ الأصلي، كفت 50 إلى 100 دورة تقريباً لتتقارب الشابكة بأكملها³.

تأمّل الشعر الحسابي في هذا. تبدأ ولا تعرف شيئاً — كلّ صفحة مساوية لغيرها في الأهمّية، ثمّ تدع بنية الشابكة نفسها تتكلّم، كلّ دورة كأنّك تسأل الإنترنت: «مَن ذو الشأن؟» فتُصغي لجوابه. وبعد جولات كافية من السؤال، يستقرّ الجواب. الشابكة تخبرك بتراتبيّتها من تلقاء ذاتها.

4. لماذا هذا عبقريّةٌ خفيّة

أناقة PageRank ليست رياضية فحسب — إنّها فلسفية. تأمّل ما فعله برين وبيج حقّاً: حوّلا سؤالاً ذاتياً («ما أفضل نتيجة لهذا البحث؟») إلى حسابٍ موضوعي («ماذا يقول المتّجه الذاتي؟»). لم يحاولا فهم المعنى أو الدلالة — بل أوكلا الحكم إلى السلوك الجمعيّ لملايين مدراء المواقع، كلٌّ منهم يقرّر باستقلال ما يستحقّ الإحالة إليه.

هذه، بمعنى ما، خوارزميةٌ ديمقراطية. كلّ رابط صوت. لكنّ الأصوات ليست سواء — فرابط من صفحة MIT الرئيسية يحمل ثقلًا يفوق بمراحل رابطاً من مدوّنة مغمورة، لأنّ صفحة MIT هي ذاتها كثيرة الاستقطاب للروابط. النظام يعزّز نفسه ويصحّح ذاته. إنّه يلتقط شيئاً حقيقياً عن كيفية انتشار الانتباه والثقة عبر الشبكات البشرية.

ثمّة صلة عميقة ههنا بنظرية سلاسل ماركوف، التي صاغها الرياضياتيّ أندريه ماركوف في مطلع القرن العشرين⁸. كان ماركوف يدرس متتاليات الأحداث المتعلّقة — وقد طبّق نظريته أوّل ما طبّقها على توزيع الحروف الصوتية والصامتة في رواية بوشكين يفغيني أونيغين. وبعد قرنٍ كامل، الرياضيات ذاتها ستنظّم معرفة البشرية جمعاء. إن لم يكن هذا شاهداً على الفعالية غير المعقولة للرياضيات، فما أدري أيَّ شاهدٍ يكفي.

«الفعالية غير المعقولة للرياضيات في العلوم الطبيعية أمرٌ يتاخم الغموض، ولا تفسير عقلاني له.»

— يوجين فيغنر، 1960⁹

V. تداعيات الموجة

لم يُنجح PageRank غوغل فحسب — بل فتح سدّاً. الفكرة الجوهرية — أنّك تستطيع استخلاص المعنى من بنية الشبكة لا من محتواها وحده — صارت تأسيسيةً عبر حقول المعرفة.

تحليل الشبكات الاجتماعية يستخدم متغيّرات من مركزية المتّجه الذاتي ذاتها لتحديد المستخدمين المؤثّرين¹⁰. علم الأحياء الحسابي يطبّق نماذج الجولة العشوائية على شبكات تفاعل البروتينات للتنبّؤ بوظائف الجينات¹¹. أنظمة التوصية في Netflix وSpotify تستخدم طرائق مبنيّة على البيانات ومنحدرة من البصيرة ذاتها. بل حتّى علم الأعصاب يستخدم تقنيات مماثلة لنمذجة تدفّق المعلومات في الدماغ¹².

الورقة الأصلية لبرين وبيج عام 1998 استُشهد بها أكثر من 25,000 مرة¹³. وهي من أكثر أوراق علم الحاسوب تأثيراً على الإطلاق. وإليك ما يذهل حقّاً — الخوارزمية الأساسية، المحرّك الرياضي الفعلي، يسع صفحة واحدة. صيغة PageRank كاملةً أربعة أسطر من الجبر الخطّي. أربعة أسطر نظّمت الإنترنت.

سباق التسلّح

بطبيعة الحال، لم تنتهِ القصة عند النقاء الرياضي. فبمجرّد أن صار PageRank حَكَماً على الظهور في الإنترنت، بدأ الناس يتلاعبون به. ظهرت «مزارع الروابط» — شبكات من مواقع زائفة تتبادل الإشارة لتنفخ الأهمّية كذباً. فردّت غوغل بإجراءات مضادّة متصاعدة التعقيد: خاصيّة nofollow عام 2005، وتحديث Panda الذي استهدف المحتوى الرديء عام 2011، ثمّ Penguin الذي عاقب مباشرةً مخططات التلاعب بالروابط عام 2012¹⁴. نظام ترتيب غوغل اليوم يستخدم مئات الإشارات، PageRank واحدة منها فقط — لكنّها تظلّ الأساس المفهومي، والنواة الفلسفية.

«تتقدّم الحضارة بتوسيع عدد العمليات المهمّة التي يمكننا أداؤها دون التفكير فيها.»

— ألفرد نورث وايتهيد، مقدّمة في الرياضيات 1911¹⁵

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

¹ Internet Live Stats. "Total Number of Websites." Historical data on web growth, 1991–present.

https://www.internetlivestats.com/total-number-of-websites/

² Hock, R. The Extreme Searcher's Internet Handbook. CyberAge Books, 2004.

³ Brin, S. & Page, L. "The Anatomy of a Large-Scale Hypertextual Web Search Engine." Computer Networks and ISDN Systems, 30(1–7): 107–117, 1998.

⁴ Page, L. et al. "The PageRank Citation Ranking: Bringing Order to the Web." Stanford InfoLab Technical Report, 1999.

http://ilpubs.stanford.edu:8090/422/

⁵ Langville, A.N. & Meyer, C.D. Google's PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press, 2006.

⁶ Meyer, C.D. Matrix Analysis and Applied Linear Algebra. SIAM, 2000. Ch. 8: Perron–Frobenius Theory of Nonnegative Matrices.

⁷ Kamvar, S.D. et al. "Extrapolation Methods for Accelerating PageRank Computations." Proc. 12th Int. Conf. on WWW (WWW '03), pp. 261–270, 2003.

⁸ Seneta, E. "Markov and the Birth of Chain Dependence Theory." International Statistical Review, 64(3): 255–263, 1996.

⁹ Wigner, E.P. "The Unreasonable Effectiveness of Mathematics in the Natural Sciences." Communications in Pure and Applied Mathematics, 13(1): 1–14, 1960.

¹⁰ Newman, M.E.J. Networks: An Introduction. Oxford University Press, 2010.

¹¹ Navlakha, S. & Kingsford, C. "The Power of Protein Interaction Networks for Associating Genes with Diseases." Bioinformatics, 26(8): 1057–1063, 2010.

¹² Fornito, A., Zalesky, A. & Bullmore, E. Fundamentals of Brain Network Analysis. Academic Press, 2016.

¹³ عدد الاستشهادات في Google Scholar لورقة برين وبيج (1998)، تمّ الوصول إليها 2025.

¹⁴ Google Search Central. "Google Search ranking updates." Official documentation.

https://developers.google.com/search/updates/ranking

¹⁵ Whitehead, A.N. An Introduction to Mathematics. Henry Holt and Company, 1911.