“الصورة بألف كلمة”.. لماذا وقعنا في حب المنتجات البصرية للذكاء الاصطناعي؟

منذ ساعة واحدة

الخامسة للأنباء - غزة

مع التطور المتسارع في نماذج الذكاء الاصطناعي التوليدي، لم تعد الصورة مجرد عنصر مكمل للنص، بل أصبحت “العملة” الأكثر قيمة في الاقتصاد الرقمي الجديد.

ففي عام 2014، نشر باحثو معهد ماساتشوستس للتكنولوجيا (MIT) الأمريكي دراسة في مجلة أتنشن بيرسيبشن آند سايكوفيزيكس (Attention Perception & Psychophysics) أثبتت أن الدماغ البشري قادر على معالجة صورة كاملة في 13 ملي ثانية فقط، أي في لمح البصر الحرفي. وهذا الرقم كان صادما لأن الدراسات السابقة كانت تقدر المدة بـ100 ملي ثانية على الأقل.

وتكشف الأبحاث الأحدث أن المعالجة البصرية واللغوية تسيران في قنوات متوازية لكنها مختلفة في الدماغ، فقناة البصر تمر عبر القشرة البصرية الأولية ثم المناطق الترابطية بسرعة هائلة دون الحاجة إلى ترجمة رمزية، في حين تحتاج اللغة المكتوبة إلى مراحل تفكيك رمزي إضافية. وبعبارة أبسط، فإن الصورة تصل إلى الفهم مباشرة، أما النص فيحتاج إلى “ترجمة” داخلية أولا.

كما يشير الباحثون إلى ما يعرف بـ”تأثير تفوق الصورة”، وهو ظاهرة موثقة في علم النفس المعرفي، فبعد 3 أيام من قراءة نص، يتذكر الإنسان نحو 10% من المعلومات، لكن حين تقرن المعلومة بصورة ترتفع نسبة التذكر إلى 65%.

وهذا ما يجعل المنتجات البصرية للذكاء الاصطناعي تلامس وترا عميقا، حيث إنها لا تنتج محتوى فحسب، بل تنتج محتوى ذا قابلية استثنائية للبقاء في الذاكرة.

وقبل الذكاء الاصطناعي التوليدي، كان الإنتاج البصري الاحترافي محجوزا لأصحاب المهارة التقنية أو المال الكافي للاستعانة بالمصممين. حيث تشير نتائج تقرير كانفا (Canva) للاقتصاد البصري عام 2024، الذي استطلع آراء 3700 قائد أعمال في 12 دولة، إلى أن 82% منهم استخدموا أدوات ذكاء اصطناعي لإنتاج محتوى بصري، وأن 77% يرون أن التواصل البصري حسّن أداءهم التجاري.

لماذا تتفوق الصورة تقنيا؟

فالصورة هي اللغة الوحيدة التي لا تحتاج إلى ترجمة، ووفقا لتقارير المنتدى الاقتصادي العالمي حول مهارات المستقبل، فإن “التواصل البصري” أصبح مهارة عابرة للحدود، إذ سمح الذكاء الاصطناعي لشخص في اليابان بإنتاج محتوى بصري يفهمه شخص في البرازيل دون الحاجة إلى قاموس، ما جعل المنتجات البصرية الأداة المثالية للعولمة الرقمية.

كيف وقعنا في حب “البكسلات الذكية”؟

لم يأت هذا الحب من فراغ، بل هو نتيجة تطور تقني مذهل في معمارية النماذج، فالتقنية تقف خلف أغلب الصور المذهلة اليوم، حيث تعمل هذه النماذج عبر إزالة “الضجيج” من صورة مشوشة تدريجيا حتى تصل إلى شكل نهائي مبهر. وهذا التدرج في البناء يحاكي طريقة عمل العقل في صياغة الذكريات أو الأحلام.

إضافة إلى أن إنتاج صورة سينمائية في السابق كان يتطلب كاميرات بآلاف الدولارات وخبرة في الإضاءة، أما الآن، وبفضل تقنيات مثل ستيبل ديفيوجن (Stable Diffusion)، يمكن لأي جهاز حاسوب متوسط القوة إنتاج جودة تضاهي أعمال هوليوود.

لماذا الصورة أهم من النص في سياق الذكاء الاصطناعي؟

في عالم البيانات الضخمة، تعد الصور “بيانات غنية”، وذلك لعدة أسباب تقنية وعملية، أهمها:

التحقق والمصداقية البصرية: ففي مجالات مثل الصحافة والتحقيق الجنائي الرقمي، الصورة هي الدليل الأول. ورغم مخاطر “التزييف العميق”، فإن الذكاء الاصطناعي البصري يساهم أيضا في بناء أدوات لكشف التزييف عبر تقنيات مثل “سي2بي إيه” (C2PA) التي تعني معايير منشأ المحتوى وتوثيقه، وتدعمها شركات مثل أدوبي ومايكروسوفت.

التدريب المتبادل: يتم تدريب نماذج اللغات الكبيرة (LLMs) بشكل متزايد على الصور لفهم العالم المادي بشكل أفضل. أي أن الذكاء الاصطناعي لا يصبح ذكيا حقا إلا عندما “يرى”.

مستقبل الصور في التطبيقات

ينتقل العالم اليوم من مرحلة “توليد الصور للمتعة” إلى مرحلة “الوظيفية البصرية الكاملة”، حيث سيغير ذلك مستقبل التطبيقات، فلن تكون واجهات التطبيقات ثابتة، بل سيقوم الذكاء الاصطناعي بتوليد واجهة مستخدم بصرية مخصصة لكل فرد بناء على حالته المزاجية أو حاجته اللحظية، وإذا كان المستخدم يفضل النمط التبسيطي، سيعيد التطبيق رسم نفسه بصريا فورا.

أما التجارة الإلكترونية الغامرة، فستنتقل تطبيقات التسوق من عرض صور المنتجات إلى توليد “تجربة بصرية مخصصة”، وذلك بفضل تقنيات مثل القياس الافتراضي، حيث سيرى المستخدم صورا لنفسه وهو يرتدي الملابس بدقة مذهلة، ما يقلل معدلات الإرجاع بنسبة كبيرة.

إضافة إلى ذلك، ستحدث ثورة في التعليم والطب، ففي الطب، سيساعد تحويل بيانات الرنين المغناطيسي المعقدة إلى صور ثلاثية الأبعاد مولدة بالذكاء الاصطناعي الأطباء على شرح الحالات للمرضى بدقة أكبر. وفي التعليم، سيتحول النص التاريخي الجاف إلى “فيلم بصري” تفاعلي داخل الفصل الدراسي.

التحديات والأخلاقيات

ولا يمكن الحديث عن حب الصور دون ذكر المخاوف، فوفقا لمنظمة هيومن رايتس ووتش، فإن سهولة توليد الصور تزيد من خطر التضليل الرقمي. كما أن حقوق الملكية الفكرية للفنانين الذين استُخدمت أعمالهم لتدريب هذه النماذج تظل نقطة صراع قانوني كبرى في محاكم الولايات المتحدة والاتحاد الأوروبي.

وعليه يقول الخبراء إن وقوعنا في حب المنتجات البصرية للذكاء الاصطناعي هو اعتراف بعجزنا السابق عن التعبير الكامل عن خيالنا، حيث منحنا الذكاء الاصطناعي “عيونا رقمية” نرى بها أفكارنا. وفي المستقبل، لن تكون الصورة مجرد أداة للتوضيح، بل ستصبح هي الواجهة الأساسية للتفاعل بين الإنسان والآلة، حيث تتلاشى الحدود بين ما نتخيله وما يمكننا رؤيته حقيقة

المصدر: الجزيرة + وكالات

الوسوم

منذ ساعة واحدة

“الصورة بألف كلمة”.. لماذا وقعنا في حب المنتجات البصرية للذكاء الاصطناعي؟

الشهيد المصور الصحفي أحمد القرا.. صاحب الابتسامة التي هزمت غبار الحرب

الشهيد المصور يحيى برزق.. عاش لينقل الحقيقة واستشهد وهو يصنعها

الصحفية الشهيدة سعاد سكيك… حين يتوقف النبض تحت وطأة القهر

مقالات ذات صلة

كيف تتحول ملامحنا إلى بيانات رقمية قابلة للتتبع؟

تحذير صادم من نجمة “Shark Tank”: جوجل تقرأ رسائلك الخاصة عبر الذكاء الاصطناعي

نهاية المونتاج التقليدي.. بريمير برو يدخل عصر الذكاء الاصطناعي

مشهد من المستقبل… مطار ياباني يبدأ استخدام روبوتات بشرية في مناولة الأمتعة

الشهيد المصور الصحفي أحمد القرا.. صاحب الابتسامة التي هزمت غبار الحرب

الشهيد المصور يحيى برزق.. عاش لينقل الحقيقة واستشهد وهو يصنعها

الصحفية الشهيدة سعاد سكيك… حين يتوقف النبض تحت وطأة القهر