تائه في البيانات الضخمة؟
الفكرة المضللة التي تسيطر على كون البيانات.

lost_in_big_data

“. . . في تلك الإمبراطورية، بلغ فن رسم الخرائط حد الكمال لدرجة أن خريطة الإقليم الواحد كانت تحتل مدينة بأكملها، وخريطة الإمبراطورية كانت تحتل إقليمًا بأكمله. وبمرور الوقت، لم تعد تلك الخرائط المبالغ فيها مرضية، فأعدت طائفة رسامي الخرائط خريطة للإمبراطورية تضاهي في مساحتها مساحة الإمبراطورية، وتطابقت معها شبرًا بشبر. . . “.

“حول الإتقان في العلم”
خورخي لويس بورخيس

 

تتخيل قصة بورخيس إمبراطورية تدمن فكرة إنشاء خريطة مثالية تصور عالمها. وقد انغمست تلك الإمبراطورية الوهمية في مهمة إنشاء خريطة تتطابق مع رقعتها شبرًا بشبر. واليوم لا يسعني إلا الاعتقاد أننا نجد أنفسنا في بيئة مماثلة جدًا: فالبيانات تُحدث تغييرًا عميقًا في عالمنا وكيفية رؤيتنا له. نجد أنفسنا في خضم ثورة بيانات هائلة وواسعة الانتشار وشابة لدرجة أنه يصعب استيعابها بالكامل. أثر البيانات متزايد الاتساع على نطاق هائل بحق؛ إننا نسعى جاهدين لاستخدام البيانات الضخمة لإحداث تحول في صناعات بأكملها، من التسويق والمبيعات إلى التنبؤات الجوية، ومن التشخيصات الطبية إلى تغليف الأطعمة، ومن تخزين الوثائق واستخدام البرمجيات إلى الاتصال. والحقيقة أنه على نحو أشبه كثيرًا بإمبراطورية بورخيس الخيالية، صرنا نعتقد أنه كلما جمعنا وحللنا بيانات أكثر، اكتسبنا المزيد من المعرفة بالعالم وبالناس الذين يعيشون فيه. فإلى أي مدى تحولنا إلى حمقى مهووسين بالبيانات.

الاعتقاد السائد الآن هو أن البيانات الضخمة تعطي أفكارًا ثاقبة يمكن التصرف بناء عليها حول كافة جوانب الحياة تقريبًا. ويجادل فيليب إيفانز وباتريك فورث بأن “المعلومات تُفهَم وتطبَّق من خلال طرق جديدة تمامًا من طرق الذكاء الاصطناعي التي تسعى إلى أفكار ثاقبة من خلال الخوارزميات التي تستخدم مجموعات بيانات صاخبة هائلة. وبما أن مجموعات البيانات الأضخم تتمخض عن أفكار ثاقبة أفضل، فالضخم شيء جميل” (من مقالهما المشترك في bcg.perspectives). على نحو مماثل، يتزايد تعطشنا للبيانات باستمرار، ونظامنا الإيكولوجي يدفعه دفعًا: أجهزة متصلة بمستشعرات، وشبكات تواصل اجتماعي، وعدد متزايد من السحب تُنتج لنا دومًا بيانات جديدة لكي نقوم بجمعها وتحليلها. وفقًا لدراسة أجرتها مؤسسة البيانات الدولية (CDI)، فإن الكون الرقمي سيتضاعف حوالي ضعفين كل سنتين. فمن 2005 إلى 2020، سينمو حجم البيانات 300 مرة، ليصل إلى 40 زيتابايت من البيانات. الزيتابايت واحد وأمامه 21 صفرًا. في هذا العالم الذي يشهد نموًا حادًا في البيانات، ينطلق طموح مراكمة البيانات بلا قيود. وكما في إمبراطورية بورخيس الخيالية، فإن الحد الخارجي هو مقياس رسم 1:1، أي صورة رقمية كاملة لعالمنا.

واليوم نجد الشركات من قبيل “آي بي إم” أو “لنكد إن” تمضي بالفعل نحو ذلك الحد. فآي بي إم تعكف على تدريب نظام الحوسبة الإدراكية الخاص بها والمسمى واطسون لكي يستطيع الإجابة عن أي سؤال تقريبًا. ولكي يفعل هذا، يعكف واطسون على جمع كميات غير مسبوقة من البيانات ومكنز هائل من المعلومات. وقد استحوذت الشركة مؤخرًا على Truven Health Analytics مقابل 2.6 مليار دولار نقدًا، مضيفة إياها إلى مستودعها الرئيسي من البيانات الصحية المستمدة من آلاف المستشفيات وأرباب العمل وحكومات الولايات عبر الولايات المتحدة. كانت هذه عملية الاستحواذ الرئيسية الرابعة على شركة للبيانات الصحية خلال عمر واطسون الذي يناهز 10 أشهر، مما يثبت مدى أهمية التوصل إلى تمثيل رقمي للمرضى والتشخيصات والعلاجات والمستشفيات لنظام الذكاء الاصطناعي العملاق الخاص بهذا الكمبيوتر. ورؤية لنكد إن طموحة بالمثل، حيث تعكف الشركة على إنشاء رسم بياني اقتصادي، وهو لا يقلّ عن كونه خريطة رقمية للاقتصاد العالمي. وتهدف إلى تضمين لمحة لكل شخص من أعضاء القوة العاملة العالمية وعددها 3 مليارات. وتهدف إلى التمثيل الرقمي لجميع الشركات ومنتجاتها وخدماتها، والفرص الاقتصادية التي تتيحها، والمهارات التي تتطلبها تلك الفرص. وتخطط لتضمين حضور رقمي لكل مؤسسة من مؤسسات التعليم العالي في العالم. لكن مساعي الشركتين ما هي إلا قمة الجبل الجليدي. فسعيهما إلى بناء تمثيل رقمي كامل لمجال كل منهما على حدة يرمز إلى طموح أعم في يومنا هذا إلى حالة من المعلومات الموجودة في كل مكان.

وهكذا فإن رؤى الشركات من قبيل آي بي إم واطسون ولكند إن تستحضر بالفعل إلى الأذهان عالم بورخيس المتخيل. قوى البيانات الضخمة تتلاقى وتستعيد طموحات الإمبراطورية التي تتحدث عنها هذه القصة على صعيد إعداد الخرائط. بدأ العالم يتحول إلى شيء ذاتي المرجع. التمثيل الرقمي لعالمنا يتوسع بسرعة، وعلى الحدود الخارجية، بدأ التمثيل والواقع يلتقيان. بدأ يحدث تلاقٍ بين العالم والصورة التي نرسمها له. فجأة، نجد أنفسنا في عالم يشبه إمبراطورية بورخيس شبهًا مفزعًا.

يا للحماقة، فقصة بورخيس تتواصل، مشككة في صميم غرض أي صورة تمثيلية ضخمة. فأي خريطة بمقياس 1:1، سواء ورقية أو رقمية، ربما لا تكون بالقيمة التي كنا نظنها.

“[. . . ] الأجيال التالية، التي لم تكن مغرمة جدًا بدراسة الخرائط على نحو ما كان أسلافهم، رأوا أن الخريطة الهائلة عديمة الفائدة، وببعض من الشفقة تركوها في لهيب الشمس وبرد الشتاء. في صحاري الغرب، حتى يومنا هذا، هناك أطلال بالية لتلك الخريطة، تسكنها الحيوانات والمتسولون، في كل الأرض لا يوجد أي أثر لعلوم الجغرافيا”.

في عالم بورخيس الخيالي، تخلصت الأجيال التالية من خريطة أسلافهم لأنهم لم يكن يستحوذ عليهم نفس الطموح الذي استولى على أسلافهم وأدركوا عدم جدوى خريطة بمقياس رسم 1:1. فتركوها تتحلل وكل ما بقي منها هو “الأطلال البالية” لخريطة الأسلاف. ينسجم إدراك أن أي خريطة بمقياس رسم 1:1 عديمة الفائدة عمليًا أيضًا مع خبرتنا مع كون البيانات المتسع. فها هو البروفسور باتريك وولف، المدير التنفيذي لمعهد البيانات الضخمة التابع لكلية لندن الجامعية، يحذر بقوله إن “المعدل الذي ننتج به البيانات بدأ يفوق بسرعة قدرتنا على تحليلها”. فلا يتم حاليًا تحليل إلا حوالي %5.0 من كافة البيانات، ويقول وولف إن تلك النسبة المئوية آخذة في التقلص فيما يُجمع المزيد من البيانات. إذن فنحن بدأنا ندرك الطبيعة غير العملية لكتل البيانات التي ننتجها. فبدلاً من اكتساب معارف متزايدة طرديًا عن عالمنا من خلال البيانات، نحن نخلق كيانًا معرضًا لخطر الانزلاق في هوة النسيان من خلال محض الحجم الهائل.

لمنع مجموعتنا الرقمية المتراكمة أبدًا من التعرض لنفس مصير خريطة بورخيس – أي أن تُترك لتتحول إلى أطلال بالية على أي أيدي أجيالنا اللاحقة – من الضروري أن نستمد منها معلومات يمكن التصرف بناء عليها. ومن ثم فالقدرة على الفهم الحقيقي لمدى تعقيد كتل البيانات المجموعة ولإنتاج المعرفة وثيقة الصلة منها ستكون الميزة التنافسية النهائية، اليوم بل وأكثر من ذلك في المستقبل.

على الرغم من أن تحويل البيانات الضخمة إلى بيانات ذكية يلقى بالفعل تأييدًا من الكثيرين، لم يظهر بعد حل حصل على براءة اختراع يُعنى بكيفية تحقيق هذا التحول. في يومنا هذا، لكل من الرياضيات التطبيقية ومعالجة اللغات الطبيعية وتعلم الآلة ثقل مساوٍ في الميزان، وتحل محل كل الأدوات الأخرى التي ربما تكون مستخدمة. إنها الفكرة القائلة بأنه بالبيانات الكافية، تتحدث الأرقام عن نفسها. تكرارًا لما قاله إيفانز وفورث: “الضخم شيء جميل”. تطبع هذه الفكرة ثقافة وادي السيليكون وبالتبعية ثقافة الكثير من المشاريع حول العالم.

ضُرب بالمنهجيات الأخرى من قبيل الأنطولوجيات، و أنظمة التصنيف و علم الدلالة عُرض الحائط انطلاقًا من روح الاكتشاف الحالية. ففيما ترمز الرياضيات التطبيقية وتعلم الآلة والتحليلات التنبؤية إلى الحجم، ترمز الأنطولوجيات وأنظمة التصنيف وعلم الدلالة إلى المعنى والفهم. وعلى الرغم من أن هذا الأخير قد يبدو ضئيلاً مقارنة بأبعاد الأولى، فإنهما سيلعبان دورًا ذا شأن في تحديد اللياقة التنافسية للشركات. بعد النمو المطرد في الكون الرقمي على مدى السنوات الأخيرة، وصلنا إلى درجة من التعقيد تتطلب إضافة فهم عميق للمسائل التي بين أيدينا. شيء لن يتحقق بجمع المزيد من البيانات أو بتنفيذ خوارزمية. إذن فالمثير للسخرية أنه تغييرًا في الاتجاه بعيدًا عن “الضخم شيء جميل” يمكنه فعلاً الاستفادة من القوة الكاملة للبيانات الضخمة.