كما قد نفكر مجددًا

عبادة صباغ
· 3.8 ألف كلمة · ١٩ دقيقة قراءة · Read in English

هذا المقال منشور أيضاً على Substack، حيث يمكنك التعليق والاشتراك. ملاحظة: هذا المقال مترجم بواسطة الذكاء الاصطناعي وليس يدويًا. سأحاول ترجمته يدويًا قريبًا.

كل بضعة أيام الآن، تظهر في خلاصتي عروض توضيحية أخرى عن “العالِم الاصطناعي”. عادةً ما تكون تغريدة سريعة الانتشار مع بضعة وجوه منذهلة ورموز صواريخ. الضجة كثيفة بالتأكيد، لكن خلفها، هناك حركة حقيقية. تغيير ما هو ممكن هو شيء يثيرني، وكذلك عدم اليقين. لذا أنا متحمس لاحتمال أن يغير الذكاء الاصطناعي كيفية قيامنا بالعلم (أو حتى التفكير فيه). المجال يتحرك بسرعة، وأجد نفسي أرغب في تنظيم أفكاري حوله، ومن هنا جاءت هذه المقالة.

منذ ثمانين عامًا، كتب فانيفار بوش مقالة بعنوان “كما قد نفكر” في مجلة ذا أتلانتيك. كان قد أصبح بحلول ذلك الوقت مديرًا لمكتب البحث والتطوير العلمي خلال الحرب، وفي تنسيقه لعمل آلاف العلماء، لاحظ كيف كانوا “مذهولين من نتائج واستنتاجات آلاف العاملين الآخرين”. تخيّل بوش ميمكس1 1 الميمكس، الذي تُصوّر كآلة بحجم المكتب، سيضغط مكتبة الشخص بأكملها على ميكروفيلم (الموسوعة البريطانية في علبة عود ثقاب)، ويسمح للمستخدمين بربط المستندات بالرمز، وإنشاء “مسارات” ترابطية للفكر بدلاً من التسلسلات الهرمية الجامدة، ومشاركة تلك المسارات مع الآخرين. يمتد عقل العالِم، بدلاً من استبداله. كان تركيزه الأساسي في تلك المقالة هو أننا بحاجة إلى أدوات لتعزيز ما اعتبره فريدًا للإنسان، وهو طريقة تفكيرنا. بينما لا نملك ميمكس تمامًا كما تصوره بوش، أعتقد أننا وصلنا بالفعل بطرق ما.

إذن ماذا يعني “العالِم الاصطناعي”؟ لا أحد يعرف. على حد علمي، إنه مثل مصطلح “الوكلاء”، الذي يعني في هذه المرحلة كل شيء من “حلقة while مع أدوات” إلى “أنظمة تنجز المهام بذكاء”2 2 سيمون ويليسون يحتفظ بفهرس جميل هنا . ومع ذلك، في محاولة لتنظيم تفكيري، يبدو لي أن هناك ثلاثة نماذج أولية ناشئة للذكاء الاصطناعي في العلوم: المساعد الطيار، والعرّافة، والمُنفّذ.

المساعد الطيار: تعزيز العلماء

من بين النماذج الثلاثة، المساعد الطيار هو على الأرجح السليل الأكثر مباشرة لميمكس بوش.

معظم العلماء ربما يحبون مساعدًا طيارًا قادرًا. الحلم بالنسبة لهم ليس ذكاءً اصطناعيًا لديه الفكرة الكبيرة بل أحد يتعامل مع الأعمال التحضيرية المرهقة حتى يكون لدينا مزيد من الوقت للعثور عليها. نظام جيد جدًا في المهام الدنيوية ولكن الأساسية سيكون ترقية ضخمة. تخيل نظامًا يجمع خطة استنساخ كاملة من معرّف جين واحد - اختيار مواقع التقييد المثلى، تصميم البادئات بدرجات حرارة الانصهار الصحيحة، محاكاة الربط، وإنتاج ملف PDF جاهز للمختبر مع رموز شريطية لعيناتك3 3 بصراحة لا أعرف كيف لم يبنِ أحد هذا بعد. إذا فعلت، يرجى التواصل. . فكر في وكيل يراقب المجهر لك طوال الليل، يكتشف انحراف التركيز، يقوم بالتعديلات، يُفعّل إعادة الاستحواذ، ويترك تقريرًا موقوتًا لك في الصباح.

بالنظر إلى أن الكثير من سير العمل في العلوم تتطلب حكمًا جيدًا في أجزاء مختلفة من العملية، يجب أن يكون المساعد الطيار أيضًا تفاعليًا. ستسمع العلماء يقولون “من خلال إجراء التجارب بنفسي، أحصل على فرصة لملاحظة تفاصيل صغيرة أو شذوذات قد تؤدي إلى اكتشاف” - وهم على حق. على سبيل المثال في علم الأحياء، خاصة في العمل الاستكشافي، الكثير منه هو: جمع ← قرار ← تصرف. نحن نجمع الأدبيات، ثم نقرر الاتجاه. نسحب البيانات الخام، ثم نقرر كيفية تنظيفها. نعالج البيانات، ثم نقرر التصميم التجريبي. نجري التحليل، ثم نقرر التجربة التالية. في كل من نقاط القرار هذه، الحكم البشري والحدس والسياق لا تزال أساسية. الذكاء الاصطناعي ليس موجودًا بعد، لكنه يمكن أن يفعل الكثير بالفعل لتحسين العملية. لهذا السبب نحتاج إلى المزيد من الأنظمة التي يكون فيها الإنسان في الحلقة. شريك شفاف ينفذ خطوة، ثم يتوقف عند المنعطفات الحرجة لتقديم نتائجه، والتماس التعليقات، وتقديم مجموعة من الخيارات المدققة للخطوة التالية4 4 ليست مختلفة عن الكثير من أدوات هندسة البرمجيات التي رأيناها تظهر في السنوات القليلة الماضية (مثل Cursor وDevin)، لكن المجال العلمي يتطلب أنماطًا تعاونية فريدة وأكثر تعقيدًا بشكل يمكن القول .

نرى بالفعل العلماء يتفاعلون مع الذكاء الاصطناعي كمساعد طيار إما من خلال بناء مجموعة تقنية مخصصة أو حتى في عميل سطح المكتب الخاص بهم. تيرينس تاو وصف مؤخرًا استخدام GPT-5 كمتعاون لا يكل في البحث العددي المضني - مشاكل اعترف أنه “كان من غير المرجح جدًا أن يحاول حتى” من تلقاء نفسه5 5 تفصيل أساسي في رواية تاو هو الطبيعة الحوارية للعمل. نجح الذكاء الاصطناعي لأنه، الخبير، وجهه خطوة بخطوة. في الواقع، كان التعاون فعالاً للغاية لدرجة أن الذكاء الاصطناعي اكتشف وصحح بالفعل العديد من الأخطاء الرياضية في مطالبات تاو نفسه. بقي الإنسان الوكيل الاستراتيجي، لكن الذكاء الاصطناعي كان أكثر من مجرد أداة لعمل شاق - كان شريكًا تصحيحيًا. . جزء مما يجعل هذا التعاون يعمل هو تقسيم طبيعي للعمل المعرفي. الابتكار أحيانًا يتطلب ربط نقاط لا ترتبط عادةً، ولكن يمكنك فقط ربط ما يمكنك الاحتفاظ به في الذهن في وقت واحد - وهنا، تصطدم الأجهزة البشرية بحدود صعبة. ننسى. نفقد المسار. حتى عندما نتذكر شيئًا، فإن الاحتفاظ بقطع متعددة في الانتباه النشط أمر صعب. الذكاء الاصطناعي لديه تذكر مثالي نسبيًا وذاكرة عمل لا نهائية. لا يعاني من الاسترجاع أو الانتباه. لذا يمكن للإنسان الآن جلب التعرف على الأنماط، الحدس، الذوق، بينما يجلب الذكاء الاصطناعي النقاط نفسها6 6 بالمناسبة، ميزة ضخمة وغير مقدرة هنا أيضًا هي أن هذه النماذج تمكن العلماء الآن من التعامل مع العمل خارج خبرتهم العميقة بطرق يسهل الوصول إليها. أتوقع أن يحفز هذا أيضًا المزيد من الابتكار في الأنواع التوليدية والإبداعية. .

أمثلة مثل هذه الحكاية من تاو تتحدث عن حقيقة أننا نحصل بالفعل على قيمة حقيقية من هذه الأنظمة. لا نحتاج إلى انتظار الذكاء الاصطناعي العام (مهما كان معنى ذلك المصطلح) لإنتاج قيمة كبيرة للعلوم. إذا كان من الممكن تفريغ حتى جزء بسيط من وقتنا الذي نقضيه حاليًا في تحسين البروتوكولات، ومراجعة الأدبيات، وتنظيم البيانات، فإن الربح في النطاق الترددي الإبداعي سيكون كبيرًا.

على هذا النحو، فإن عنق الزجاجة الحاسم لبناء هذه الأنظمة ليس بقدر ما هو الذكاء الاصطناعي بل الطريقة التي يمكن للعلماء التفاعل معه. كما ذكرت أعلاه، عالم هندسة البرمجيات للذكاء الاصطناعي يستكشف هذا بالفعل بأدوات تقترح الكود، والذي يقبله الإنسان بعد ذلك أو يرفضه أو يعدله. المكافئ العلمي هو مجال مفتوح تمامًا. والقدرة على تجهيز وكيل بمجموعة من الأدوات التي يمكن أن ينفذها عبر MCP أصبحت أسهل وأسهل7 7 مجموعة Zitnik بنت مؤخرًا قاعدة بيانات رائعة جدًا من أكثر من 600 أداة من هذا القبيل هنا. . ما هي الواجهة الصحيحة لعالم أحياء لتنظيف مجموعة بيانات بشكل تعاوني مع ذكاء اصطناعي؟ ما هو تجربة المستخدم لتصميم تجربة معقدة حيث يقوم المساعد الطيار بتوفير الكواشف، والتحقق من توفر الأدوات، والإشارة إلى المخاطر المحتملة في الوقت الفعلي؟ أين هو المساعد الطيار الشبيه بكورتانا في أذن العالم أثناء وجوده على المقعد؟

ظهور المساعدات الطيارة الخاصة بالمجال مثل CRISPR-GPT والمساعدات ذات الأغراض العامة مثل Biomni8 8 أنا معجب جدًا بالوتيرة التي يقوم بها فريق Biomni بتوسيع وكيلهم منذ فتح مصدره والبناء مع المجتمع. شيء يجب متابعته بالتأكيد. تلمح إلى المستقبل. المسار إلى مساعد طيار جوهري للذكاء الاصطناعي يبدو قابلاً للتحقيق وعمليًا، لكنه يتطلب منا حل كل من الأدوات والواجهة التي من خلالها يتعاون هذا الذكاء مع ذكائنا. وهو وشيك. الطرق الروتينية في علم الأحياء مثل كل تلك التي ذكرتها أعلاه ستكون قريبًا آلية9 9 من المهم ملاحظة هنا أنه، بينما أنا متفائل جدًا بشأن أنظمة المساعد الطيار هذه، فإنها لا تزال تهلوس، وتفوت السياق، وما إلى ذلك. جيد للعروض التوضيحية ولكن لا يزال هناك طريق للذهاب للتطبيق المستقر في الحياة الواقعية. .

العرّافة: أتمتة الاكتشاف

المساعد الطيار يعزز ما نفعله بالفعل. لكن هناك رؤية أكثر طموحًا: نظام يقوم بالعلوم نفسه.

هذا ما سأسميه العرّافة. بذلك أعني نظامًا يخرج إجابات أو ادعاءات من البداية إلى النهاية دون الحاجة إلى حكم بشري في كل خطوة10 10 العرّافة هنا هي مجموعة بحثية (أ) تستوعب البيانات، (ب) تولد الفرضيات، (ج) تصمم/تنفذ التحليلات، و (د) تنتج استنتاجات مع المصدر. . أنت تطالب بسؤال، وتعيد فرضية دون تدخل بشري. الهندسة التي تجعل هذا يبدو معقولاً هي نظام متعدد الوكلاء، حيث يتفاعل وكلاء متعددون بأدوار متخصصة، ويتنافسون، ويتعاونون لاستكشاف مساحة المشكلة بشكل أكثر شمولاً من أي عالم فردي.

هذا يبدو أكثر جذرية، وأكثر إغواءً، وأصعب بكثير في التقييم11 11 لدينا مشكلة قياس/تقييم هنا في علم الأحياء. . أفضل نظام متعدد الوكلاء رأيته حتى الآن للبحث وأجزاء التوليف من التفكير هو على الأرجح Google AI Co-Scientist12 12 كان لدي وصول مبكر إلى هذا النظام وكنت معجبًا جدًا. على الرغم من أنه من المقرر تحديده على خاصية العرافة الخاصة به. . هناك أيضًا شركات مثل FutureHouse، الذين يطورون منصات متعددة الوكلاء تتعامل مع أجزاء متميزة من العملية العلمية، من تجميع الأدبيات إلى التصميم التجريبي.

الأنظمة التي تعمل بالفعل اليوم لا تحاول أن تكون عرّافات كلية المعرفة. إنها أشبه بمنشئي طرق عالية التركيز، أو محسّنات.

تعمل بشكل أفضل عندما يمكنك أن تعطيها هدفًا واضحًا وقابلاً للتحقق. على سبيل المثال، TusoAI المنشور مؤخرًا هو نظام وكلاء يُحسّن الأساليب العلمية بمجرد أن تعطيه وظيفة تقييم للهدف. تخبره بما يبدو عليه “الجيد”، ويكرر لبناء أداة حسابية أفضل. وبالمثل، AlphaEvolve من DeepMind يستخدم نموذج لغوي كبير لتطوير مجموعات الكود لإيجاد هياكل رياضية أفضل، والتي يتم بعد ذلك التحقق منها تلقائيًا. نظام مختلف من Google Research قرن نموذج لغوي كبير مع بحث الشجرة لإنشاء برامج بمستوى الخبراء بشكل منهجي، متفوقًا على الطرق التي طورها البشر على لوحات المتصدرين العامة في مجالات من المعلوماتية الحيوية إلى علم الأوبئة13 13 يستحق الذكر أنه، على الأقل في الوقت الحالي، هذه الطرق لبحث الشجرة مكلفة جدًا. .

لكن هذا هو المكان الذي تبدأ فيه شكوكي. هناك توتر أساسي بين كيفية تدريبنا حاليًا للذكاء الاصطناعي وطبيعة الاكتشاف العلمي نفسها، وأرى ثلاث مشاكل متشابكة تحتاج إلى حل: السلوك المطابق، وقاعدة المعرفة المعيبة، و”الفهم” للنموذج14 14 على هذا النحو. الأعمى بالسياق.

مشكلة السلوك

الاكتشاف الرائد، والذي يبدو أن هذه التقنية تعد به، غالبًا ما يأتي من اكتشاف تناقض بين التوقع والمراقبة والحصول على الحكم الجيد (الذوق؟) لنسأل، “همم، ما الذي يحدث هنا؟“15 15 أو، كما قال أسيموف، “أكثر عبارة مثيرة يمكن سماعها في العلوم، تلك التي تبشر باكتشافات جديدة، ليست “وجدتها” بل “هذا مضحك…” . نكهة أخرى من هذا هو التخلي عن عقيدة المجال والتفكير في المشكلة من المبادئ الأولى. أو كما قال ابن الهيثم منذ ألف عام: “إذن واجب الرجل الذي يحقق في كتابات العلماء، إذا كان تعلم الحقيقة هو هدفه، هو أن يجعل نفسه عدوًا لكل ما يقرأه، وأن يطبق عقله على جوهر وهوامش محتواه، ويهاجمه من كل جانب.”

لكن نماذج الذكاء الاصطناعي اليوم محسّنة للعكس تمامًا. إنها مطابقة، مدربة للتنبؤ بالرمز التالي ومعززة للتقارب على الإجابات الصحيحة المعروفة. حتى نماذج التفكير التي تقضي مزيدًا من الوقت في التفكير لا تزال تُحسّن نحو حلول الإجماع، وليس التشكيك فيما إذا كنا نطرح الأسئلة الصحيحة. عندما تنحرف مشاكل الاختبار عن أنماط التدريب، ينهار الأداء. نحن نبني حلالي مشاكل قويين عندما يتطلب الاكتشاف باحثًا قويًا عن المشاكل.

مشكلة المعرفة

‘قمامة تدخل، قمامة تخرج’ هو نقد شائع في التعلم الآلي، وأود أن أركز على نوع معين من القمامة هنا. نحن نطلب من الأنظمة التي تعلمت المسارات المطروقة جيدًا للمعرفة القائمة أن تجد المسارات الجديدة تمامًا والاختراقات. والأسوأ من ذلك، أن عرّافة مدربة على الأدبيات العلمية مدربة على قطعة أثرية معيبة بشدة.

مستودع نقي للحقيقة منشورات المجلات المراجعة من قبل النظراء ليست. السجل العام مشوه بتحيز النشر، حيث يتم الاحتفال بالنتائج الإيجابية وتختفي النتائج السلبية في أدراج الملفات16 16 مما يعني أن النموذج لا يرى أبدًا آلاف التجارب الفاشلة التي حددت حدود ما هو ممكن. وبالتالي يعيش في منظر طبيعي خيالي لما هو ممكن. . إنه مليء بالأخطاء الإحصائية، وp-hacking،17 17 P-hacking يشير إلى ممارسة التلاعب بتحليل البيانات حتى تظهر نتيجة ذات دلالة إحصائية، غالبًا عن طريق تجربة اختبارات متعددة والإبلاغ فقط عن تلك التي “تعمل”. والمطاردة لإشارات الهيبة على الدقة. عندما ندرب أنظمة الذكاء الاصطناعي على هذه المجموعة، نشبعها بأمراض محددة. تتعلم النماذج المبالغة في وزن مجلات البريق - شيء رأيت نماذج اللغة الكبيرة بشكل أعمى (كما نفعل) تظهر الاحترام له18 18 تمتص النماذج أزياء وعقائد المجال كحقيقة أساسية وتتعلم أن بعض النُهج التجريبية “أفضل” ببساطة لأنها تظهر بشكل أكثر تكرارًا أو في مجلة “عالية التأثير”، وليس لأنها أكثر صحة. . أطعم كل هذه الأمتعة في أولويات البحث التي ينشئها الذكاء الاصطناعي، وستكون قد أنشأت حلقة ردود فعل من العلوم السيئة بسرعة الآلة.

أنا متفائل بأن حل مشكلة المعرفة للعرافة هو يد بيد مع حل كيفية نشرنا للعمل العلمي. لكن حتى ذلك الحين، نحن ندرب عرافاتنا على خريطة تُظهر فقط القمم ولا أي من الوديان.

مشكلة السياق

لنفترض أننا حللنا الأدبيات، ولنفترض أننا دربنا الذكاء الاصطناعي بنجاح للعثور على الشذوذات ومتابعتها، فإنه سيظل يواجه عقبة أساسية في علم الأحياء وهي الاعتماد على السياق.

الكثير من بياناتنا، في النص أو غير ذلك، مراقبة بحتة19 19 هذا شيء كبير في كل من علم الأحياء وعلم الأعصاب. . حتى مع القياسات المثالية الدقيقة، تُظهر المراقبة فقط ما يتزامن. وبالتالي، فإن النماذج الكبيرة المدربة على هذه البيانات ستكون ترابطية فقط، حتى لو بدت تتنبأ بعلاقات سببية. تصبح النماذج جيدة حقًا في الارتباط، لكن علم الأحياء هو علم التفاعلات والتدخلات. وظيفة الجين ليست حقيقة ثابتة. ما يفعله الإزالة الكاملة يعتمد تمامًا على البيئة الخلوية، والأنواع، ومرحلة النمو. يمكن أن يكون نفس الاضطراب مميتًا في سياق واحد، محايدًا في آخر، مفيدًا في الثالث.

لتوضيح هذه النقطة بطريقة أخرى، تمتد هذه المشكلة إلى العلاقات التطورية نفسها. نماذج الأساس غالبًا ما تفشل في حساب السياق النشوئي، تخطئ في انتشار التسلسلات عبر السلالات ذات الصلة للياقة البيولوجية20 20 هذا مشابه للخلط بين التردد والجودة في بيانات التدريب. نوع من مثل كيف أن العبارات الشائعة في النص على الإنترنت لا تمثل بالضرورة لغة “أفضل”، قد تعكس تسلسلات بيولوجية سائدة ببساطة تحيز أخذ العينات من السلالات الناجحة بدلاً من الحلول المثلى للمشاكل البيولوجية. عندما تكون هذه ظواهر متميزة شكلتها عمليات مختلفة. تسلسل بروتين يظهر في 100 نوع مرتبط بشكل وثيق يبدو مثل 100 ملاحظة مستقلة لنموذج، لكن في الواقع يمثل نمطًا سلفيًا واحدًا تم تكراره عبر الزمن التطوري. سواء كان السياق المفقود هو التاريخ التطوري، أو الحالة الخلوية، أو توقيت النمو، فإن المشكلة الأساسية هي نفسها: تتعلم النماذج الأنماط في البيانات دون استيعاب القواعد الشرطية التي ولدتها.

ما هو مهم هنا هو أن عرّافة مدربة على النص أو البيانات المراقبة بحتة لا يمكن أن تستوعب هذه القواعد. حتى مع زيادة حجم النماذج، وبتكلفة كبيرة، لا يبدو أنها تتعلم أشياء مثيرة للاهتمام بشكل متناسب. إذن ماذا يمكننا أن نفعل بشكل أفضل؟

تأسيس العرّافة في الواقع

قضيت ثلاثة أقسام في الانتقاد، لذا إليكم الجزء البناء - هذه المشاكل لها حلول، إنها فقط أصعب من توسيع المعاملات. عندما تبدأ في التفكير في السياق بيولوجيًا، تصبح الأبعاد بسرعة مذهلة: كمية X من الجينات ضرب عدد Y من نوع الخلية ضرب المرحلة Z من النمو ضرب كل نوع ضرب كل حالة بيئية إلخ. لكنه ليس مستعصيًا. إنه يعني فقط أن نهج “قراءة جميع الأوراق والتوصل إلى أفكار” ليس هو أفضل طريق هنا. المسار إلى عرّافة مفيدة يجب أن يكون متأسسًا في الواقع المادي، مبني على مبادئ توفر بيانات أفضل وحوافز أفضل للنموذج.

أولاً، يجب أن ندرب على تجارب حقيقية مع تدخلات، وليس فقط ملاحظات. نماذج الأساس “الجيل الثاني” الأكثر واعدة تتعلم من الاضطرابات. عندما تزيل جينًا باستخدام CRISPR أو تُجرع خلايا بمركب، تحصل على إشارة سببية أقوى بكثير من مشاهدة ما يحدث بشكل طبيعي. النماذج المدربة على شاشات الاضطراب المنهجي تتعلم ما يحدث بالفعل عندما تضغط على النظام، وليس فقط ما يميل إلى التزامن21 21 هذه ميزة في تدريب نماذج مثل Noetik على استجابات الأورام للعلاج المناعي، أو لماذا يستخدم MintFlow بيانات الاضطراب المكاني. إنهم يتعلمون من التجارب حيث نعرف السهم السببي. .

ثانيًا، التوسع عبر الطرق، وليس فقط المعاملات. من المحتمل أن يكون هناك الكثير من القيمة لفتحها مع البيانات المقترنة من نفس العينة (على سبيل المثال الجينوم، النسخ، البروتيوم، والمورفولوجيا، كلها في سياقها المكاني الأصلي). عندما يكون لديك كل هذه الآراء في وقت واحد، لا يمكن للنموذج أن يختبئ خلف غموض نوع بيانات واحد. هنا، أنا مهتم جدًا بما تفعله Noetik بنموذجها OCTO-VC. إنهم يدربونها على النسخ المكاني المقترن، البروتيوميات المكانية، الإكسومات، والأنسجة من 77 مليون خلية عبر 2500 عينة ورم بشري. عليه التوفيق بين ما يقوله RNA مع ما تُظهره البروتينات مع كيف تبدو الخلايا فعليًا. يجب أن يكون التوسع عبر الطرق (والمقياس البيولوجي) أيضًا دعوة للعمل لنا لتطوير مناهج أفضل عالية الإنتاجية، محايدة للأنسجة، عالية الأبعاد لتحديد النمط الظاهري مما لدينا الآن.

ثالثًا، كافئ الانحرافات عن التوقع، وليس المعقولية النصية. بدلاً من طلب من الذكاء الاصطناعي أن يأتي بفكرة جديدة، يجب أن نعلمه توقعاتنا ونكافئه لإيجاد انتهاكات ذات مغزى لها. هذا يعني أننا بحاجة إلى أن نكون محددين حول ما تعنيه “المكافأة”. إنها ليست مجرد درجة. إنها الفرق المقاس بين نتيجة الفحص وما توقع نموذج خط الأساس أن يكون. وظيفة مكافأة جيدة ستعاقب أيضًا عدم اليقين العالي وتحسب فقط النتائج مع سلسلة كاملة من المصدر، يتتبع إلى العينة المحددة والأداة. هذا يدفع الذكاء الاصطناعي للتصرف مثل عالم حقيقي، يسعى بنشاط إلى التجارب الأكثر إفادة في المجالات التي نفهمها أقل، وليس فقط تأكيد ما نعرفه بالفعل. مركب يقتل الخلايا السرطانية مع تجنيب الخلايا الصحية بما يتجاوز ما تتنبأ به نماذج الانتقائية - هذا انحراف قابل للتحقق. اضطراب وراثي يمدد عمر الحياة بما يتجاوز ما تقترحه النماذج المضافة - هذا انحراف قابل للتحقق. بروتوكول تمايز ينتج خلايا أسرع من الحركية القائمة - هذا انحراف قابل للتحقق. هذه لا يتم الحكم عليها بما إذا كانت تبدو جيدة في ملخص ورقة، ولكن من خلال أحجام تأثيرها المعتمدة في الفحوصات الفعلية.

في هذا النظام، قيمة العرافة ليست في أن تكون صحيحة بنسبة 100٪، ولكن في تقديم فرضيات اتجاهية حيث لم يكن أي منها موجودًا سابقًا. إنها تتعلم من الواقع المباشر، الفوضوي، عالي الأبعاد لما تفعله اضطراباتنا فعليًا.

إنه في الواقع مثير لي أن طبيعة هذه التحديات تغير أساسيًا من يمكنه بناء أشياء مفيدة. ليس فقط حول من لديه أفضل فريق ML22 22 وربما حتى ليس من لديه أكثر حساب؟ من الواضح أنه لا يمكنك فقط رمي المعاملات على المشكلة. ، ولكن من لديه التكامل الأكثر إحكامًا بين الحساب، والمختبر الرطب، والتأسيس في السياق العلمي الصحيح. المجال واسع مفتوح ولا يزال في أيامه الأولى.

المُنفّذ: الذكاء الاصطناعي يلتقي بالأجهزة

النموذج الأولي الثالث هو ربما الأكثر طموحًا: المُنفّذ الذي يغلق الحلقة بين التنبؤ الرقمي والواقع المادي.

حيث يعزز المساعد الطيار الحكم البشري وتنتج العرافة الفرضيات، ينفذ المُنفّذ التجارب بشكل مستقل. إنها الطبقة الروبوتية التي تأخذ التنبؤات الحسابية إلى المختبر الرطب23 23 فكر في معالجات السوائل تُمزج الكواشف، المجاهر تتبع مورفولوجيا الخلية، مطياف الكتلة يحلل المركبات، إلخ. . الكثير من الناس يتصورون وعد مختبر ذاتي القيادة يعمل 24/7 كوسيلة لإطعام نماذج جائعة للبيانات. إنه قابل للتنفيذ، يمكننا ضغط سنوات من البحث في أشهر أثناء توليد مجموعات البيانات الضخمة التي تحتاجها النماذج، لكن التفاؤل سيصطدم بالواقع وهناك تحديات كبيرة لحلها.

بعض حقائق الأتمتة

تحديات المُنفّذ ليس لها علاقة بالحساب. سير عمل واحد لزراعة الخلايا الآلية يتطلب إتقان قائمة مرجعية من المشاكل الصعبة بوحشية: نقل الخلايا المعقمة دون تلوث، تبادل الوسائط مع كشف الفقاعات، تقدير الاندماج من الصور الصاخبة، تكيف البروتوكول في الوقت الفعلي عندما تنخفض العوائد، كل ذلك مع الحفاظ على التحكم الدقيق في CO₂ ودرجة الحرارة. حدث تلوث واحد يمكن أن يدمر أسابيع من العمل.

الفجوة بين المحاكاة وواقع المقعد واسعة. معالج السوائل يعمل بشكل رائع حتى يفشل مع وسائط الخلايا اللزجة. تنسد النصائح. تتشكل الفقاعات بشكل غير متوقع. الكهرباء الساكنة تجعل المساحيق تقفز عبر الآبار. التكثيف يضبب أجهزة الاستشعار البصرية التي تعتمد عليها لضمان الجودة. يجب أن يكون نظامًا قويًا مهندسًا لكشف والتعافي من كل وضع فشل.

عنق الزجاجة الفوري هو أن معظم معدات المختبر الأصلية غبية بشكل أساسي. تفتقر الأجهزة المختبرية في العديد من الشركات الناشئة والمختبرات الأكاديمية إلى الوصول إلى API أو الخطافات الرقمية اللازمة للأتمتة الحديثة. لديك آلات بملايين الدولارات لا يمكنها إخبارك إذا كانت قيد التشغيل أو الإيقاف بدون إنسان يتحقق من LED. تتحدث الأدوات القديمة بروتوكولات خاصة إذا تحدثت على الإطلاق. تعمل الطبقة المادية للعلوم على الأقدام والرموز الشريطية المطبوعة. نحن نحاول بناء مختبرات ذاتية القيادة بمعدات مصممة للأيدي والعيون البشرية.

لنكون منصفين، يتم إحراز بعض التقدم لسد هذه الفجوة. تثبت المختبرات السحابية ما يمكن أن تفعله مجموعة مدفوعة بالبرمجيات بالكامل، وتظهر معايير مفتوحة أخيرًا24 24 للتحكم في الأجهزة، معايير مثل SiLA 2 تدفع للحصول على APIs مفتوحة. للبيانات، مبادرات مثل Allotrope تحاول توحيد التنسيقات. لكن الاعتماد سيستغرق وقتًا. . وبعد ذلك هناك نُهج أولاً بالبيانات مثل Ganymede، التي تركز على السباكة لربط ومركزية البيانات من جميع المعدات القديمة التي لديها المختبر بالفعل. لكن هذه لا تزال الاستثناءات. تظل الأداة المتوسطة صندوقًا غبيًا مصممًا للإنسان، وليس لوكيل.

البناة الذين يسعون لسد الفجوة بين الذكاء الاصطناعي والمختبرات المستقلة

بعض الشركات تتعامل مع هذا بشكل مباشر. أنا متحمس لأشخاص مثل Medra AI في سان فرانسيسكو. بدلاً من استبدال الأجهزة القديمة، يمنحون هذه الأدوات الغبية تعديلاً ذكيًا، باستخدام مزيج من رؤية الكمبيوتر والروبوتات لمنحهم العيون والأيدي اللازمة للمشاركة في سير عمل آلي. إنه عملي ويمكّن العلماء من الاحتفاظ بأدواتهم المألوفة.

آخرون، مثل Lila في بوسطن، يبنون المجموعة بأكملها من الصفر. إنهم يبنون ما يسمونه “الذكاء العظيم العلمي”25 25 مصطلح جديد آخر… ، يجمع بين الذكاء الاصطناعي والمختبرات المستقلة للحياة والعلوم الكيميائية وعلوم المواد. ما يجعل نهجهم مثيرًا للاهتمام هو حلقة ردود الفعل: كل قياس، كل تجربة، كل فشل يتم التقاطه وإرجاعه إلى الذكاء الاصطناعي، الذي سيولد بعد ذلك على الأرجح فرضيات أفضل. إنه مسعى ضخم للقيام بذلك عبر تخصصات متعددة في وقت واحد26 26 يستحق الذكر أن Lila ظهرت كدمج لشركتين في مرحلة مبكرة في Flagship، واحدة تركز على البيولوجيا وواحدة على المواد، لذا فهم يبدأون بالخبرة من أكثر من مجال واحد. ، لكن إذا نجح، يمكن للمقياس أن يمكّن من استكشافات منهجية مثيرة لمساحة المعاملات.

Periodic Labs اتخذ نهجًا مختلفًا بالبدء بشكل ضيق. إنهم يبنون مختبرات تصنيع المساحيق المستقلة التي تولد بيانات خاصة27 27 حلقتهم ضيقة: الذكاء الاصطناعي يقترح المواد، الروبوتات تصنعها، الأدوات تميزها، النتائج تعود لتحسين التنبؤات. . من خلال اختيار مجال حيث الأتمتة قابلة للتحقيق، مع مواد مستقرة وقراءات واضحة، يمكنهم فعليًا إغلاق الحلقة التجريبية على نطاق واسع. Mirror Physics أيضًا تقترب من هذا بمشاكل ضيقة النطاق، تركز على التنبؤ بنتائج التجارب في الكيمياء وعلوم المواد من خلال تدريب الذكاء الاصطناعي الذي “يتعلم من كميات هائلة من المحاكاة الكيميائية، ويبقى في توافق وثيق مع الواقع بفضل التحقق عالي الإنتاجية في المختبر.” من ما أجمعه، تقضي Mirror أيضًا وقتًا في التركيز على طبقة الواجهة بين التنبؤ الحسابي والتجريب المادي.

ربما لاحظت أن عددًا قليلاً من هذه الشركات الجديدة تبدأ بعلم الأحياء. لست متأكدًا من السبب (ومن الممكن تمامًا أيضًا أن يكون ذلك بسبب جهلي الخاص بالمنظمات الجديدة الموجودة)، لكني أشك في أن الكيمياء والفيزياء وعلوم المواد توفر نتائج تجريبية أوضح، وعينات أكثر استقرارًا، وتقلبًا سياقيًا أقل. علم الأحياء أكثر غموضًا وفوضى وأصعب في التشغيل على نطاق واسع مقارنة ببعض التخصصات العلمية الأخرى.

الرؤية النهائية لذكاء اصطناعي يتصور فكرة وينفذها في مختبر مستقل تمامًا ويحقق اختراقات لا تزال بعيدة جدًا. لا أحد يعرف المسار إلى النجاح هنا وهناك الكثير لنتعلمه بينما نكتشف هذا. إنه وقت مثير لإعادة اختراع كيف يقوم البشر بالاكتشاف.

ما التالي

إذن أين يتركنا هذا؟ التفكير في هذه النماذج الأولية يثير مجموعة من التحديات والفرص التي تمس كل شيء من البيانات التي نجمعها إلى الأسئلة التي نختار طرحها. بدون ترتيب معين، إليك بعض الأفكار التي لدي بينما أفكر في ذلك.

  1. التوسع. كنت أتحدث مع الكثير من الأشخاص المصممين الذين يبنون علماء ذكاء اصطناعي أو بعض نماذج ML للعلوم، وواحد من أكثر الأشياء شيوعًا التي ستسمعها هو “نحتاج إلى مزيد من البيانات”28 28 عدد المرات التي سمعت فيها “نحتاج إلى Scale AI للعلوم…” . وقد يكون ذلك صحيحًا، و يجب علينا جميعًا أن نكون مدروسين حول نوع البيانات التي نحتاجها وبأي حجم. في علم الأحياء، قوانين التوسع تعمل حتى لا تعمل.

  2. البيانات والقياس. عندما نتحدث عن الحاجة إلى مزيد من البيانات، على الأقل في علم الأحياء (على الرغم من أنني أفترض أن هذا ينطبق في مكان آخر)، من المفيد إعادة النظر في القياسات التي نريد إجراءها. يمكننا تحسين الكثير في كيفية قياسنا لتعقيد العالم الطبيعي. حتى الآن، العديد من نُهجنا للقياس متحيزة بطبيعتها مع افتراضات مسبقة حول الأسئلة التي نطرحها والعينة التي نتعامل معها. هناك أسباب تاريخية جيدة لذلك، لكننا الآن في وقت جديد. إذا كنت تعرف أن لديك قدرات حسابية لا تصدق، بالتفكير من المبادئ الأولى، ما نوع القياسات عالية الأبعاد التي ستجريها؟ هل يمكن أن يُعلم ذلك نماذجنا بشكل أفضل من طرقنا القديمة؟

  3. بناء مساعد طيار خاص أولاً. المعرفة الأكثر قيمة في المختبر غالبًا ما تكون تاريخها الخاص لما لم ينجح. يجب أن نبدأ بتدريب نموذج متخصص على بياناتنا الداخلية الخاصة - بروتوكولاتنا، سجلات أدواتنا، تجاربنا الفاشلة. اجعله خبيرًا في غرائب مختبرنا والسياق قبل أن نطلب منه حل كل العلوم. هذا يخلق قيمة فورية وعملية ويبني أساسًا من البيانات الخاصة عالية الجودة.

  4. أتمتة كل شيء. البيانات الأكثر قيمة للنماذج المستقبلية لن تكون في الأدبيات. نحن بحاجة إلى مزيد من الإخراج الخام عالي الدقة من أجهزتنا الخاصة مُغنّى بالبيانات الوصفية. نحتاج إلى التقاط وتنظيم هذه البيانات بشكل هوسي. أنا حتى أفكر في كيف يمكننا التقاط الطرق التي نفكر بها، المعرفة الضمنية التي لا تُكتب أو تُقال.

  5. المصدر. أي أدوات ذكاء اصطناعي نعتمدها، سواء كانت مساعدات طيارة أو عرّافات، يجب أن تتتبع كل ادعاء إلى البيانات المصدرية، وإصدار البرنامج، والمعاملات. نحتاج إلى البناء مع وضع هذا في الاعتبار؛ إنه حاسم بشكل خاص عندما تصبح هذه الأنظمة أكثر استقلالية.

  6. المقاييس. نحن بحاجة ماسة إلى طرق موحدة لتقييم هذه الأنظمة بما يتجاوز “انظر إلى هذا العرض التوضيحي الرائع” أو “انظر كيف يمكننا توليد تسلسلات جديدة”. ماذا يعني أن يكون الذكاء الاصطناعي جيدًا في علم الأحياء؟ كيف نقيم خلية افتراضية؟ كيف نقيس التقدم نحو عرّافات مفيدة؟ المجال بحاجة إلى معايير واضحة وقابلة للتكرار تلتقط التحديات العلمية الحقيقية، وليس فقط مطابقة الأنماط على مجموعات بيانات معروفة. هناك بعض الأعمال الجديرة بالثناء هنا لكن المجال لا يزال غير متطور. ولنكون منصفين، من الصعب جدًا قياس شيء مثل توليد الفرضيات في نظام فوضوي مثل خلية أو كائن حي.

  7. ما الأسئلة التي تستحق الطرح. أعتقد أن القيام بالعلوم، تمامًا مثل خلق الفن، هو واحد من أكثر الأشياء الإنسانية عمقًا التي نقوم بها. إذا قمنا ببناء آلات تؤتمت كيفية الإجابة على الأسئلة، فمن المفيد الحديث عن ما يعنيه ذلك بالنسبة لنا. ليس فقط كعلماء، كبشر. ربما سينتقل دورنا إلى لماذا وماذا. مهارة غير مقدرة في العلوم هي معرفة أي الأسئلة مهمة، وهذا سيصبح المساهمة البشرية الحاسمة. عندما تصبح أدوات الذكاء الاصطناعي هذه أكثر قوة، سينتقل دور العالم بعيدًا عن كونه فنيًا وباتجاه كونه قيّمًا على الفضول. لن يكون عنق الزجاجة إيجاد الإجابات، بل الذوق والحكم والإبداع لتوجيه كل تلك القوة إلى المشاكل التي تستحق الحل29 29 في سلسلة مقنعة جدًا، يجادل جاسشا سول-ديكشتاين بأن هذا تحدٍ استراتيجي عاجل. نصيحته للعلماء الشباب هي تجنب بشكل نشط المشاكل التي سيتم حلها بالتوسع على أي حال وبدلاً من ذلك التركيز على العمل “الغريب” غير الزائد عن الحاجة حيث توفر الرؤية البشرية ميزة فريدة. .

  8. الحدس العلمي. جزء كبير من كونك عالمًا هو تطوير “شعور” لنظامك. أتذكر تعلم الإحساس عندما تبدو الخلايا العصبية غير سعيدة، أو عندما تشعر البيانات بأنها خاطئة فقط. هناك جمالية لذلك الحدس. إنها جزء كبير من المكافأة ومتعة العلوم - الشرارة التي تأتي من المشاركة المباشرة الفوضوية مع العالم. إذا لم نكن مقصودين، والذكاء الاصطناعي يتعامل مع كل العمل الروتيني، فقد نخاطر بخلق جيل من الطالبين، منفصلين عن عملية الاكتشاف نفسها. هناك مجال لإعادة تخيل كيف ندرب العلماء، وفي هذا المستقبل30 30 الذي، دعني أذكرنا، حرفيًا لا أحد يعرف كيف سيبدو. ، ربما يجب أن يكون التركيز لتعميق علاقتنا الخاصة بالأسئلة. أو ربما “الحدس” الجديد هو تعلم التعاون بشكل فعال مع ذكاء غير بشري. قيادة الأوركسترا، إذا جاز التعبير.

  9. كيف نشارك وننتقد العلوم. الطريقة التي ننشر بها العمل هي عنق زجاجة رئيسي، مبني على نظام مجلات يزدهر على الندرة على التعاون وينتج ملفات PDF ثابتة ومدفوعة بدلاً من شيء مفتوح وديناميكي وقابل لإعادة الاستخدام. بعض الممولين قد بدأوا بالفعل في فرض المسألة31 31 مع مؤسسة غيتس كونها واحدة من الأوائل. . يمنحنا الذكاء الاصطناعي سببًا ومسارًا لإصلاح هذا. بدلاً من حبس العمل في الأوراق، يجب أن نجعل جميع المخرجات العلمية FAIR32 32 مبادئ FAIR التوجيهية هي مجموعة من المعايير لجعل البيانات قابلة للعثور عليها، ويمكن الوصول إليها، وقابلة للتشغيل المتبادل، وقابلة لإعادة الاستخدام لكل من البشر والآلات. - كائنات حية ومُتحكم فيها بالإصدار تحزم الكود والبيانات الخام. يمكننا مشاركة دفاتر المختبر مباشرة (كل من دفاتر المختبر الإلكترونية الفعلية وأيضًا دفاتر Jupyter33 33 مثال هنا. ) وأن يكون لدينا طبقة LLM حولها. يمكن للوكلاء المستقلين بعد ذلك تحليل تدفق البيانات العامة هذا لاقتراح تفسيرات بديلة أو الإشارة إلى نتائج متضاربة. النقد نفسه سيصبح طبقة بيانات، مجمعة من كل ركن من أركان المحادثة العلمية ومرتبطة في النهاية بنتائج العالم الحقيقي. هذا يغير الهدف من نشر قصة نهائية إلى المشاركة في محادثة ديناميكية وقابلة للتحقق. هناك الكثير من المجال للتجربة هنا، الطريقة الأفضل غير معروفة - لكنها بالتأكيد ليست المجلات كما نعرفها.