هوش مصنوعی، پایانی بر جستجوی اینترنتی به شکلی که می‌شناختیم

هوش مصنوعی، پایانی بر جستجوی اینترنتی به شکلی که می‌شناختیم
Image Credit: George Wylesol

هوش مصنوعی به معنای پایان جستجوی اینترنتی است که تاکنون می‌شناختیم. همه ما با اصطلاح "گوگل کردن" آشنا هستیم: چند کلمه کلیدی را در کادر جستجو وارد می‌کنیم و در ازای آن، لیستی از لینک‌های آبی به مرتبط‌ترین نتایج دریافت می‌کنیم. شاید توضیحات مختصری در بالا، یا نقشه‌ها، امتیازات ورزشی یا یک ویدیو هم نمایش داده شود. اما در نهایت، این فرآیند فقط بازیابی اطلاعاتی است که از قبل در اینترنت وجود دارد و به شکلی ساختارمند به ما نشان داده می‌شود.

اما همه این‌ها در حال تغییر است. ما در یک نقطه عطف جدید قرار داریم. بزرگ‌ترین تحول در نحوه ارائه اطلاعات توسط موتورهای جستجو از دهه ۱۹۹۰ تاکنون، همین حالا در حال وقوع است. دیگر خبری از جستجوی کلیدواژه‌ها نیست. دیگر نیازی به کلیک کردن و مرور لینک‌ها نیست. در عوض، وارد عصر جستجوی مکالمه‌ای شده‌ایم. به این معنا که به جای استفاده از کلیدواژه‌ها، سوالات واقعی و به زبان طبیعی می‌پرسیم و به جای لینک‌ها، پاسخ‌هایی دریافت می‌کنیم که توسط هوش مصنوعی تولید شده‌اند و بر اساس اطلاعات زنده از سراسر اینترنت ارائه می‌شوند.

گوگل، شرکتی که در ۲۵ سال گذشته جستجو را تعریف کرده، تلاش می‌کند در این زمینه پیشرو باشد. در مه ۲۰۲۳، این شرکت شروع به آزمایش پاسخ‌های تولیدشده توسط هوش مصنوعی به جستجوها کرد و از مدل زبانی بزرگ خود (LLM) برای ارائه پاسخ‌هایی استفاده کرد که شبیه به پاسخ‌های یک منبع متخصص یا دوست مورد اعتماد هستند. گوگل این پاسخ‌ها را "مرورهای هوش مصنوعی" نامیده است. ساندار پیچای، مدیرعامل گوگل، این تغییر را به MIT Technology Review به عنوان "یکی از مثبت‌ترین تغییرات ما در جستجو در طول زمان طولانی" توصیف کرد.

مرورهای هوش مصنوعی به طور اساسی نوع سوالاتی که گوگل می‌تواند به آن‌ها پاسخ دهد را تغییر می‌دهند. مثلاً می‌توانید بپرسید: "ماه آینده به مدت یک هفته به ژاپن می‌روم. در توکیو اقامت خواهم داشت اما می‌خواهم چند سفر یک روزه انجام دهم. آیا جشنواره‌هایی در نزدیکی برگزار می‌شود؟ شرایط موج‌سواری در کاماکورا چگونه خواهد بود؟ آیا گروه‌های موسیقی خوبی در حال اجرا هستند؟" و یک پاسخ کامل دریافت خواهید کرد — نه فقط یک لینک به ردیت، بلکه یک پاسخ جامع با نتایج به‌روز.

مهم‌تر این که، اکنون می‌توانید جستجوهایی انجام دهید که قبلاً تقریباً غیرممکن بود و پاسخ درست دریافت کنید. لازم نیست دقیقاً بدانید که به دنبال چه چیزی هستید. می‌توانید توصیف کنید که پرنده‌ای در حیاط شما چگونه به نظر می‌رسد، یا مشکلی که با یخچال شما وجود دارد چیست، یا آن صدای عجیبی که ماشین شما تولید می‌کند، و یک توضیح تقریباً انسانی دریافت کنید که از منابع مختلف اینترنت گردآوری شده است. این شگفت‌انگیز است و وقتی شروع به جستجو به این روش کنید، اعتیادآور خواهد بود.

اما این فقط گوگل نیست. ChatGPT شرکت OpenAI اکنون به اینترنت دسترسی دارد و در یافتن پاسخ‌های به‌روز به سوالات شما بسیار بهتر عمل می‌کند. مایکروسافت در سپتامبر نتایج جستجوی تولیدی را برای Bing منتشر کرد. متا نیز نسخه خود را دارد. استارت‌آپ Perplexity هم همین کار را انجام می‌دهد، اما با رویکرد "سریع حرکت کن، چیزها را خراب کن". تریلیون‌ها دلار در این رقابت در خطر است، زیرا این شرکت‌ها تلاش می‌کنند تا منبع بعدی بازیابی اطلاعات — گوگل بعدی — شوند.

اما همه از این تغییر خوشحال نیستند. ناشران کاملاً نگران هستند. این تغییر ترس از آینده‌ای بدون کلیک (zero-click) را افزایش داده است، جایی که ترافیک ارجاعی جستجو — که از قبل از وجود گوگل نیز پایه اصلی وب بوده است — از بین می‌رود.

من تصویری از آن آینده را در ژوئن گذشته دیدم، زمانی که یک اعلان از برنامه Perplexity روی تلفنم دریافت کردم. Perplexity یک استارت‌آپ است که تلاش می‌کند جستجوی وب را دوباره اختراع کند. اما علاوه بر ارائه پاسخ‌های عمیق به سوالات، این برنامه مقالات کامل درباره اخبار روز ایجاد می‌کند که توسط هوش مصنوعی از منابع مختلف گردآوری شده‌اند.

در آن روز، این برنامه داستانی درباره یک شرکت جدید پهپادی از اریک اشمیت به من کرد. من این داستان را شناختم. فوربس آن را به طور انحصاری در همان هفته گزارش کرده بود، اما پشت دیوار پرداخت قفل شده بود. تصویر در داستان Perplexity دقیقاً شبیه به تصویر فوربس بود. زبان و ساختار نیز بسیار مشابه بود. این اساساً همان داستان بود، اما به طور رایگان در دسترس هر کسی در اینترنت قرار داشت. من به دوستی که داستان اصلی را ویرایش کرده بود پیام دادم تا بپرسم آیا فوربس قراردادی با این استارت‌آپ برای بازنشر محتوای خود دارد یا خیر. اما هیچ قراردادی وجود نداشت. او شوکه و عصبانی بود و خوب، سردرگم. او تنها نبود. فوربس، نیویورک تایمز و Condé Nast همگی اخطارهای توقف و خودداری به این شرکت ارسال کرده‌اند. نیوز کورپ نیز برای خسارات شکایت کرده است.

مردم نگران هستند که این نتایج جدید مبتنی بر مدل‌های زبانی بزرگ (LLM) چه معنایی برای واقعیت مشترک ما خواهد داشت. این ممکن است به معنای پایان پاسخ‌های استاندارد و معتبر باشد.

این دقیقاً سناریوی کابوس‌واری بود که ناشران از آن می‌ترسیدند: هوش مصنوعی محتوای ارزشمند آن‌ها را جمع‌آوری می‌کرد، دوباره بسته‌بندی می‌کرد و به مخاطبان خود ارائه می‌داد، به گونه‌ای که دیگر هیچ دلیلی برای کلیک کردن و رفتن به منبع اصلی باقی نمی‌گذاشت. در واقع، در صفحه "درباره" Perplexity، اولین دلیلی که برای انتخاب این موتور جستجو ذکر شده است، "رد شدن از لینک‌ها" است.

اما این فقط مربوط به ناشران نیست. مردم همچنین نگران هستند که این نتایج جدید مبتنی بر مدل‌های زبانی بزرگ چه معنایی برای واقعیت مشترک ما خواهد داشت. مدل‌های زبانی تمایل دارند چیزهایی را از خود بسازند — آن‌ها می‌توانند چرندیات را توهم کنند. علاوه بر این، هوش مصنوعی تولیدی می‌تواند هر بار پاسخ کاملاً جدیدی به همان سوال ارائه دهد، یا پاسخ‌های متفاوتی به افراد مختلف بر اساس آنچه درباره آن‌ها می‌داند، بدهد. این ممکن است به معنای پایان پاسخ‌های استاندارد و معتبر باشد.

اما اشتباه نکنید: این آینده جستجو است. خودتان آن را امتحان کنید و خواهید دید.

البته، ما همیشه می‌خواهیم از موتورهای جستجو برای پیمایش وب و کشف منابع جدید و جالب اطلاعات استفاده کنیم. اما لینک‌ها به حاشیه رانده شده‌اند. نحوه‌ای که هوش مصنوعی می‌تواند یک پاسخ منطقی به تقریباً هر نوع سوالی بدهد، با استفاده از داده‌های زنده از سراسر وب، تجربه بهتری ارائه می‌دهد. این موضوع به ویژه در مقایسه با آنچه جستجوی وب در سال‌های اخیر تبدیل شده است، صادق است. اگر نگوییم کاملاً خراب است (داده‌ها نشان می‌دهند که افراد بیشتری از همیشه از گوگل استفاده می‌کنند)، حداقل به طور فزاینده‌ای شلوغ و دلهره‌آور شده است.

چه کسی می‌خواهد مجبور باشد زبان موتورهای جستجو را صحبت کند تا آنچه نیاز دارد را پیدا کند؟ چه کسی می‌خواهد لینک‌ها را مرور کند وقتی می‌تواند پاسخ‌های مستقیم دریافت کند؟ و شاید: چه کسی می‌خواهد مجبور باشد یاد بگیرد وقتی می‌تواند فقط بداند؟

در ابتدا Archie بود. این اولین موتور جستجوی واقعی اینترنت بود که فایل‌هایی را که قبلاً در تاریکی سرورهای دورافتاده پنهان شده بودند، کرال می‌کرد. به شما نمی‌گفت که در آن فایل‌ها چیست — فقط نام آن‌ها را نشان می‌داد. تصاویر را پیش‌نمایش نمی‌کرد؛ هیچ سلسله‌مراتبی از نتایج نداشت، یا حتی رابط کاربری چندانی نداشت. اما یک شروع بود. و نسبتاً خوب بود.

سپس تیم برنرز-لی وب جهانی را ایجاد کرد و انواع صفحات وب پدید آمدند. صفحه اصلی موزاییک، پایگاه داده اینترنتی فیلم‌ها، Geocities، رقص همستر، حلقه‌های وب، Salon، eBay، CNN، سایت‌های دولت فدرال و صفحه اصلی یک نفر در ترکیه.

تا این که در نهایت، وب آنقدر بزرگ شد که حتی نمی‌دانستیم از کجا شروع کنیم. واقعاً به راه بهتری برای پیمایش و پیدا کردن چیزهایی که نیاز داشتیم، نیاز داشتیم.

و بنابراین در سال ۱۹۹۴ جری یانگ یاهو را ایجاد کرد، یک دایرکتوری سلسله‌مراتبی از وب‌سایت‌ها. این به سرعت به صفحه اصلی میلیون‌ها نفر تبدیل شد. و خوب … قابل قبول بود. با توجه به گذشته، فکر می‌کنم همه ما فکر می‌کردیم که آن زمان خیلی بهتر از چیزی بود که واقعاً بود.

اما وب همچنان به رشد و گسترش خود ادامه داد و هر روز اطلاعات بیشتری به صورت آنلاین قرار می‌گرفت. به جای فقط یک لیست از سایت‌ها بر اساس دسته‌بندی، به چیزی نیاز داشتیم که واقعاً به همه آن محتوا نگاه کند و آن را فهرست‌بندی کند. تا اواخر دهه ۹۰، این به معنای انتخاب از بین انواع موتورهای جستجو بود: AltaVista، AlltheWeb، WebCrawler و HotBot. و آن‌ها خوب بودند — یک پیشرفت بزرگ. حداقل در ابتدا.

اما همراه با ظهور موتورهای جستجو، اولین تلاش‌ها برای سوء استفاده از توانایی آن‌ها در ارائه ترافیک نیز آغاز شد. ترافیک ارزشمند و گران‌بها، که ناشران وب برای فروش تبلیغات به آن متکی هستند و خرده‌فروشان از آن برای جلب توجه به محصولات خود استفاده می‌کنند. گاهی اوقات این به معنای پر کردن صفحات با کلیدواژه‌ها یا متن‌های بی‌معنی بود که صرفاً برای بالا بردن صفحات در نتایج جستجو طراحی شده بودند. این وضعیت به حدی بد شد.

و سپس گوگل آمد. سخت است که انقلابی بودن گوگل را زمانی که در سال ۱۹۹۸ راه‌اندازی شد، بیش از حد بزرگ جلوه دهیم. به جای فقط اسکن محتوا، به منابعی که به یک وب‌سایت لینک می‌دادند نیز نگاه می‌کرد، که به ارزیابی مرتبط بودن آن کمک می‌کرد. برای ساده‌گویی: هرچه چیزی در جای دیگری بیشتر ذکر می‌شد، گوگل آن را قابل اعتمادتر می‌دانست و در نتایج بالاتر نشان می‌داد. این پیشرفت گوگل را به طور چشمگیری بهتر از هر چیزی که قبلاً وجود داشت، در بازیابی نتایج مرتبط کرد. این شگفت‌انگیز بود.

برای ۲۵ سال، گوگل بر جستجو مسلط بود. گوگل برای اکثر مردم، جستجو بود. (میزان این تسلط در حال حاضر موضوع چندین بررسی قانونی در ایالات متحده و اتحادیه اروپا است.)

اما گوگل مدتهاست که از ارائه صرف یک سری لینک آبی فاصله گرفته است، همانطور که پاندو نایاک، دانشمند ارشد جستجوی گوگل، اشاره می‌کند.

او می‌گوید: "این فقط نتایج به اصطلاح وب نیست، بلکه تصاویر و ویدیوها، و چیزهای خاص برای اخبار نیز وجود دارد. پاسخ‌های مستقیم، پاسخ‌های فرهنگ لغت، ورزش، پاسخ‌هایی که با گراف دانش همراه هستند، چیزهایی مانند قطعات برجسته." او فهرستی از اقدامات گوگل در طول سال‌ها برای پاسخ مستقیم‌تر به سوالات را برمی‌شمارد.

درست است: گوگل در طول زمان تکامل یافته و بیشتر به یک پورتال پاسخ تبدیل شده است. ابزارهایی اضافه کرده است که به مردم اجازه می‌دهد فقط یک پاسخ دریافت کنند — امتیاز زنده یک بازی، ساعات باز بودن یک کافه، یا یک قطعه از وب‌سایت FDA — به جای این که به یک وب‌سایت هدایت شوند که ممکن است پاسخ در آن باشد.

اما وقتی کمی از مرورهای هوش مصنوعی استفاده کنید، متوجه می‌شوید که آن‌ها متفاوت هستند.

به عنوان مثال، قطعات برجسته، بخش‌هایی که گوگل گاهی اوقات انتخاب می‌کند تا در بالای نتایج نشان دهد. آن کلمات مستقیماً از یک منبع اصلی نقل شده‌اند. همین موضوع در مورد پنل‌های دانش نیز صادق است، که از اطلاعات ذخیره شده در طیف وسیعی از پایگاه‌های داده عمومی و گراف دانش گوگل، پایگاه داده‌ای با تریلیون‌ها واقعیت درباره جهان، تولید می‌شوند.

در حالی که این‌ها می‌توانند نادرست باشند، منبع اطلاعات قابل شناسایی (و قابل اصلاح) است. در یک پایگاه داده است. می‌توانید آن را جستجو کنید. اما دیگر اینطور نیست: مرورهای هوش مصنوعی می‌توانند هر بار کاملاً جدید باشند، به صورت لحظه‌ای توسط متن پیش‌بینیکننده یک مدل زبانی و یک ایندکس از وب تولید شوند.

پیچای به MIT Technology Review گفت: "فکر می‌کنم این یک لحظه هیجان‌انگیز است که ما به وضوح جهان را فهرست‌بندی کرده‌ایم. ما درک عمیقی بر اساس آن با گراف دانش ساخته‌ایم. ما از مدل‌های زبانی بزرگ و هوش مصنوعی تولیدی برای بهبود درک خود از همه این‌ها استفاده کرده‌ایم. اما اکنون می‌توانیم با آن تولید و ترکیب کنیم."

نتیجه بیشتر شبیه به پرسیدن از یک دوست بسیار باهوش و کتابخوان است تا پرس‌و‌جو از یک پایگاه داده. (با این نکته که این دوست گاهی اوقات اگر پاسخ را نداند، چیزهایی را از خود می‌سازد.)

لیز رید، رئیس بخش جستجوی گوگل، از مقر این شرکت در مانتین ویو، کالیفرنیا به من می‌گوید: "ماموریت [شرکت] سازماندهی اطلاعات جهان است. اما در واقع، برای مدتی کاری که ما انجام می‌دادیم سازماندهی صفحات وب بود. که واقعاً همان سازماندهی اطلاعات جهان یا قابل استفاده و در دسترس قرار دادن آن برای شما نیست."

این مفهوم دوم — دسترسی — چیزی است که گوگل واقعاً با مرورهای هوش مصنوعی روی آن تمرکز کرده است. این احساسی است که من بارها در گفت‌و‌گو با مدیران گوگل شنیده‌ام: آن‌ها می‌توانند انواع پیچیده‌تر سوالات را با کارایی بیشتری با استفاده از یک مدل زبانی برای کمک به ارائه پاسخ‌ها، پاسخ دهند. و می‌توانند این کار را به زبان طبیعی انجام دهند.

این برای آینده‌ای که جستجو فراتر از پرس‌و‌جوهای متنی می‌رود، حتی مهم‌تر خواهد بود. به عنوان مثال، Google Lens که به مردم اجازه می‌دهد عکس بگیرند یا تصویری را آپلود کنند تا اطلاعات بیشتری درباره چیزی به دست آورند، از پاسخ‌های تولیدشده توسط هوش مصنوعی استفاده می‌کند تا به شما بگوید ممکن است به چه چیزی نگاه کنید. گوگل حتی توانایی پرس‌و‌جو از ویدیوی زنده را نیز نمایش داده است.

وقتی پاسخی ندارد، یک مدل هوش مصنوعی می‌تواند با اطمینان پاسخ‌هایی را بیرون بریزد. برای گوگل، این می‌تواند یک مشکل واقعی باشد. برای بقیه ما، این می‌تواند واقعاً خطرناک باشد.

پیچای می‌گوید: "ما قطعاً در ابتدای یک سفر هستیم که در آن مردم قادر خواهند بود سوالات بسیار پیچیده‌تری بپرسند و پاسخ دریافت کنند نسبت به آنچه در دهه گذشته بوده است."

در اینجا برخی خطرات واقعی وجود دارد. اول از همه: مدل‌های زبانی بزرگ به شما دروغ می‌گویند. آن‌ها توهم می‌کنند. آن‌ها اشتباه می‌کنند. وقتی پاسخی ندارند، یک مدل هوش مصنوعی می‌تواند با بی‌خیالی و اطمینان پاسخ‌هایی را بیرون بریزد. برای گوگل، که در ۲۰ سال گذشته اعتبار خود را بر پایه قابلیت اطمینان بنا کرده است، این می‌تواند یک مشکل واقعی باشد. برای بقیه ما، این می‌تواند واقعاً خطرناک باشد.

در مه ۲۰۲۴، مرورهای هوش مصنوعی برای همه در ایالات متحده راه‌اندازی شد. اوضاع خوب پیش نرفت. گوگل، که مدت‌ها میز مرجع جهان بود، به مردم گفت که سنگ بخورند و چسب روی پیتزای خود بگذارند. این پاسخ‌ها بیشتر در پاسخ به چیزی بود که شرکت آن را "پرس‌و‌جوهای خصمانه" می‌نامد — آن‌هایی که طراحی شده‌اند تا آن را به دام بیندازند. اما باز هم. این خوب به نظر نمی‌رسید. شرکت به سرعت شروع به رفع مشکلات کرد — به عنوان مثال، با حذف محتوای تولیدشده توسط کاربر از سایت‌هایی مانند ردیت، که برخی از پاسخ‌های عجیب از آن‌جا آمده بودند.

با این حال، در حالی که اشتباهات آن در گفتن به مردم که سنگ بخورند همه توجه‌ها را به خود جلب کرد، خطر موذی‌تر ممکن است زمانی رخ دهد که چیزی کمتر آشکارا اشتباه می‌گوید. به عنوان مثال، در انجام تحقیقات برای این مقاله، از گوگل پرسیدم که MIT Technology Review چه زمانی آنلاین شد. این پاسخ مفیدی داد که "MIT Technology Review حضور آنلاین خود را در اواخر سال ۲۰۲۲ راه‌اندازی کرد." این برای من به وضوح اشتباه بود، اما برای کسی که کاملاً با این نشریه آشنا نبود، آیا این اشتباه آشکار می‌شد؟

من چندین مثال مانند این را هم در گوگل و هم در جستجوی ChatGPT شرکت OpenAI دیدم. چیزهایی که به اندازه‌ای از هدف دور هستند که بلافاصله به عنوان اشتباه دیده نشوند. گوگل امیدوار است که با تکیه بر آنچه درباره منابع باکیفیت می‌داند، بتواند به مرور زمان این نتایج را بهبود بخشد.

نایاک می‌گوید: "وقتی مرورهای هوش مصنوعی تولید می‌کنیم، به دنبال اطلاعات تأییدکننده از نتایج جستجو هستیم، و خود نتایج جستجو طوری طراحی شده‌اند که تا حد امکان از این منابع قابل اعتماد باشند. این‌ها برخی از مکانیسم‌هایی هستند که ما داریم تا اطمینان حاصل کنیم که اگر فقط مرور هوش مصنوعی را مصرف کنید، و نخواهید بیشتر جستجو کنید … امیدواریم که همچنان یک پاسخ قابل اعتماد و معتبر دریافت کنید."

در مورد بالا، پاسخ سال ۲۰۲۲ ظاهراً از یک منبع قابل اعتماد آمده بود — داستانی درباره خبرنامه‌های ایمیلی MIT Technology Review، که در سال ۲۰۲۲ راه‌اندازی شدند. اما ماشین اساساً سوء تفاهم کرده بود. این یکی از دلایلی است که گوگل از انسان‌ها — ارزیاب‌ها — برای ارزیابی دقت نتایجی که ارائه می‌دهد، استفاده می‌کند. ارزیابی‌ها مرورهای هوش مصنوعی فردی را اصلاح یا کنترل نمی‌کنند؛ بلکه به آموزش مدل برای ساخت پاسخ‌های بهتر کمک می‌کنند. اما ارزیاب‌های انسانی می‌توانند خطا کنند. گوگل روی این موضوع نیز کار می‌کند.

نایاک می‌گوید: "ارزیاب‌هایی که به آزمایش‌های شما نگاه می‌کنند ممکن است متوجه توهم نشوند، زیرا به نوعی طبیعی به نظر می‌رسد. و بنابراین شما واقعاً باید روی تنظیمات ارزیابی کار کنید تا مطمئن شوید که وقتی توهمی وجود دارد، کسی بتواند اشاره کند و بگوید، این یک مشکل است."

موتور جستجو

گوگل

این غول جستجو مرورهای هوش مصنوعی را به نتایج جستجو اضافه کرده است. این مرورها اطلاعات را از سراسر وب و گراف دانش گوگل جمع‌آوری می‌کنند و از مدل زبانی Gemini شرکت برای ایجاد پاسخ‌ها به جستجوها استفاده می‌کنند.

چیزی که در آن خوب است

مرورهای هوش مصنوعی گوگل در ارائه یک خلاصه قابل هضم در پاسخ به حتی پیچیده‌ترین سوالات عالی هستند، با جعبه‌های منبع در کنار پاسخ‌ها. در میان گزینه‌های اصلی، ایندکس عمیق وب آن بیشترین حس "اینترنتی" را دارد. اما ناشران وب نگران هستند که خلاصه‌های آن‌ها دلیلی برای کلیک کردن و رفتن به منبع اصلی باقی نگذارد.

Perplexity

Perplexity یک موتور جستجوی مکالمه‌ای است که از مدل‌های زبانی بزرگ شخص ثالث از OpenAI و Anthropic برای پاسخ به سوالات استفاده می‌کند.

Perplexity در گردآوری جستجوهای عمیق در پاسخ به سوالات کاربران عالی است، پاسخ‌هایی تولید می‌کند که مانند مقالات سفید کوچک در مورد موضوعات پیچیده هستند. همچنین در خلاصه‌سازی رویدادهای جاری عالی است. اما با ناشران بد شده است، که می‌گویند با محتوای آن‌ها سریع و بی‌پروا برخورد می‌کند.

ChatGPT

در حالی که گوگل هوش مصنوعی را به جستجو آورد، OpenAI جستجو را به ChatGPT آورد. سوالاتی که مدل تشخیص می‌دهد از یک جستجوی وب بهره‌مند می‌شوند، به طور خودکار یک جستجوی وب را فعال می‌کنند، یا کاربران می‌توانند به صورت دستی گزینه اضافه کردن یک جستجوی وب را انتخاب کنند.

به لطف توانایی آن در حفظ زمینه در طول یک مکالمه، ChatGPT برای انجام جستجوهایی که از سوالات پیگیری بهره‌مند می‌شوند — مانند برنامه‌ریزی یک تعطیلات از طریق چندین جلسه جستجو — خوب کار می‌کند. OpenAI می‌گوید کاربران گاهی اوقات در تحقیق درباره سوالات "۲۰ دور عمیق" می‌روند. از بین این سه، این کم‌ترین لینک‌ها را به ناشران نشان می‌دهد.

وقتی با پیچای در این مورد صحبت کردم، او ابراز خوش‌بینی کرد درباره توانایی شرکت در حفظ دقت حتی با تولید پاسخ‌ها توسط مدل زبانی بزرگ. این به این دلیل است که مرورهای هوش مصنوعی بر اساس مدل زبانی بزرگ پرچم‌دار گوگل، Gemini، است اما همچنین از گراف دانش و منابع معتبر در سراسر وب استفاده می‌کند.

او می‌گوید: "شما همیشه با درصدها سر و کار دارید. کاری که ما انجام داده‌ایم این است که آن را در سطحی که من می‌گویم چند نه از اعتماد و واقعیت و کیفیت ارائه می‌دهیم. می‌گویم ۹۹ نقطه چند نه. فکر می‌کنم این معیاری است که ما با آن کار می‌کنیم، و این در مورد مرورهای هوش مصنوعی نیز صادق است. و بنابراین سوال این است که آیا ما قادریم این کار را دوباره در مقیاس انجام دهیم؟ و فکر می‌کنم هستیم."

با این حال، خطر دیگری نیز وجود دارد، و آن این است که مردم همه چیزهای عجیب و غریب را از گوگل می‌پرسند. اگر می‌خواهید darkest secrets کسی را بدانید، به تاریخچه جستجوی آن‌ها نگاه کنید. گاهی اوقات چیزهایی که مردم از گوگل می‌پرسند بسیار تاریک هستند. گاهی اوقات غیرقانونی هستند. گوگل نه تنها باید بتواند مرورهای هوش مصنوعی خود را زمانی که یک پاسخ می‌تواند مفید باشد، مستقر کند؛ بلکه باید بسیار مراقب باشد که آن‌ها را زمانی که یک پاسخ ممکن است مضر باشد، مستقر نکند.

رید می‌گوید: "اگر بروید و بگویید 'چگونه یک بمب بسازم؟' خوب است که نتایج وب وجود داشته باشد. این وب باز است. شما می‌توانید به هر چیزی دسترسی داشته باشید. اما ما نیازی نداریم که یک مرور هوش مصنوعی داشته باشیم که به شما بگوید چگونه یک بمب بسازید، درست است؟ ما فقط فکر نمی‌کنیم که این ارزشش را داشته باشد."

اما شاید بزرگ‌ترین خطر — یا بزرگ‌ترین ناشناخته — برای هر کسی که در پایین‌دست یک جستجوی گوگل قرار دارد، باشد. به عنوان مثال، ناشران، که برای دهه‌ها به جستجوها متکی بوده‌اند تا مردم را به سمت آن‌ها هدایت کنند. اگر تمام اطلاعاتی که به دنبال آن هستند در نتیجه جستجو وجود داشته باشد، چه دلیلی دارد که مردم به منبع اصلی کلیک کنند؟

رند فیشکین، هم‌بنیان‌گذار شرکت تحقیقات بازار SparkToro، تحقیقاتی درباره جستجوهای بدون کلیک (zero-click) منتشر می‌کند. همانطور که گوگل بیشتر و بیشتر وارد کسب‌و‌کار پاسخ شده است، نسبت جستجوهایی که بدون کلیک پایان می‌یابند، افزایش یافته است. حس او این است که مرورهای هوش مصنوعی این روند را منفجر خواهند کرد.

او می‌گوید: "اگر شما به گوگل برای ترافیک متکی هستید، و آن ترافیک بود که کسب‌و‌کار شما را به جلو می‌برد، شما در مشکل کوتاه‌مدت و بلندمدت هستید."

پیچای پیامش این است: وحشت نکنید. او استدلال می‌کند که حتی در عصر مرورهای هوش مصنوعی، مردم هنوز هم برای بسیاری از انواع جستجوها می‌خواهند کلیک کنند و عمیق‌تر بروند. او می‌گوید: "اصل زیربنایی این است که مردم برای اطلاعات می‌آیند. آن‌ها همیشه به دنبال این نیستند که گوگل فقط پاسخ دهد. گاهی اوقات بله، اما اکثر اوقات، شما به آن به عنوان یک نقطه شروع نگاه می‌کنید."

رید، از سوی دیگر، استدلال می‌کند که چون مرورهای هوش مصنوعی به مردم اجازه می‌دهد سوالات پیچیده‌تری بپرسند و بیشتر در آنچه می‌خواهند عمیق شوند، حتی می‌توانند برای برخی انواع ناشران و کسب‌و‌کارهای کوچک مفید باشند، به ویژه آن‌هایی که در حوزه‌های تخصصی فعالیت می‌کنند: "شما اساساً به مخاطبان جدیدی دست می‌یابید، زیرا مردم اکنون می‌توانند آنچه را که می‌خواهند به طور خاص‌تر بیان کنند، و بنابراین کسی که تخصص دارد نیازی ندارد برای پرس‌و‌جوی عمومی رتبه‌بندی شود."

"من با چیزی پرخطر شروع می‌کنم،" نیک تورلی از محدوده یک پنجره Zoom به من می‌گوید. تورلی رئیس محصول ChatGPT است، و چند هفته قبل از راه‌اندازی، ابزار جستجوی جدید OpenAI را به من نشان می‌دهد. او می‌گوید: "من معمولاً باید این را قبلاً امتحان می‌کردم، اما فقط می‌خواهم برای شما جستجو کنم. این همیشه یک دموی پرخطر است، زیرا مردم تمایل دارند درباره آنچه در اینترنت درباره آن‌ها گفته می‌شود، حساس باشند."

او نام من را در یک فیلد جستجو تایپ می‌کند، و موتور جستجوی نمونه اولیه چند جمله بیرون می‌دهد، تقریباً مانند یک بیوگرافی سخنران. من و نقش فعلی‌ام را به درستی شناسایی می‌کند. حتی داستانی که سال‌ها پیش نوشته‌ام و احتمالاً شناخته‌شده‌ترین داستان من بود را برجسته می‌کند. به طور خلاصه، پاسخ درست است. خیالتان راحت باشد؟

چند هفته پس از تماس ما، OpenAI جستجو را در ChatGPT گنجاند، پاسخ‌های مدل زبانی خود را با اطلاعات از سراسر وب تکمیل کرد. اگر مدل تشخیص دهد که یک پاسخ از اطلاعات به‌روز بهره‌مند می‌شود، به طور خودکار یک جستجوی وب اجرا می‌کند (OpenAI نمی‌گوید شرکای جستجوی آن چه کسانی هستند) و آن پاسخ‌ها را در پاسخ خود می‌گنجاند، با لینک‌هایی به بیرون اگر بخواهید بیشتر بدانید. شما همچنین می‌توانید به صورت دستی آن را مجبور کنید که وب را جستجو کند اگر به طور خودکار این کار را انجام ندهد. OpenAI فاش نمی‌کند که چند نفر از جستجوی وب آن استفاده می‌کنند، اما می‌گوید حدود ۲۵۰ میلیون نفر به طور هفتگی از ChatGPT استفاده می‌کنند، که همه آن‌ها به طور بالقوه در معرض آن قرار دارند.

کوین ویل، مدیر ارشد محصول OpenAI، می‌گوید: "مقدار باورنکردنی محتوا در وب وجود دارد. چیزهای زیادی در زمان واقعی اتفاق می‌افتد. شما می‌خواهید ChatGPT بتواند از آن استفاده کند تا پاسخ‌های خود را بهبود بخشد و یک دستیار فوق‌العاده بهتر برای شما باشد."

بر اساس گفته‌های فیشکین، این اشکال جدیدتر جستجوی مبتنی بر هوش مصنوعی هنوز بر تسلط جستجوی گوگل چالش ایجاد نکرده‌اند. او می‌گوید: "به نظر نمی‌رسد که این‌ها در حال از بین بردن اشکال کلاسیک جستجوی وب باشند."

OpenAI اصرار دارد که واقعاً قصد رقابت در جستجو را ندارد — اگرچه صادقانه به نظر من این کمی مانند تنظیم انتظارات است. در عوض، می‌گوید جستجوی وب بیشتر وسیله‌ای است برای به دست آوردن اطلاعات به‌روزتر از داده‌های موجود در مدل‌های آموزشی آن، که تمایل دارند تاریخ‌های قطع مشخصی داشته باشند که اغلب ماه‌ها، یا حتی یک سال یا بیشتر، در گذشته هستند. در نتیجه، در حالی که ChatGPT ممکن است در توضیح نحوه عملکرد یک حمله ساحل غربی عالی باشد، مدت‌ها در گفتن آخرین امتیاز 49ers بی‌فایده بوده است. دیگر نه.

ویل به من می‌گوید: "من از این دیدگاه به آن نگاه می‌کنم که 'چگونه می‌توانیم ChatGPT را قادر سازیم تا به هر سوالی که دارید پاسخ دهد؟ چگونه می‌توانیم آن را برای شما در زندگی روزمره مفیدتر کنیم؟' و این جایی است که جستجو برای ما وارد می‌شود. مقدار باورنکردنی محتوا در وب وجود دارد. چیزهای زیادی در زمان واقعی اتفاق می‌افتد. شما می‌خواهید ChatGPT بتواند از آن استفاده کند تا پاسخ‌های خود را بهبود بخشد و بتواند یک دستیار فوق‌العاده بهتر برای شما باشد."

امروز ChatGPT قادر است پاسخ‌هایی برای رویدادهای خبری بسیار جاری، و همچنین اطلاعات تقریباً بلادرنگ درباره چیزهایی مانند قیمت سهام تولید کند. و در حالی که رابط کاربری ChatGPT مدت‌هاست که خسته‌کننده بوده است، نتایج جستجو انواع مختلفی از چندرسانه‌ها — تصاویر، نمودارها، حتی ویدیو — را به همراه می‌آورند. این یک تجربه بسیار متفاوت است.

ویل همچنین استدلال می‌کند که ChatGPT آزادی بیشتری برای نوآوری و رفتن به راه خود نسبت به رقبایی مانند گوگل — حتی بیشتر از شریک خود مایکروسافت با Bing — دارد. هر دوی آن‌ها کسب‌و‌کارهای وابسته به تبلیغات هستند. OpenAI نیست. (حداقل هنوز نه.) درآمد خود را از توسعه‌دهندگان، کسب‌و‌کارها و افرادی که مستقیماً از آن استفاده می‌کنند، به دست می‌آورد. در حال حاضر بیشتر در حال سوزاندن مقادیر زیادی پول است — بر اساس برخی گزارش‌ها، پیش‌بینی می‌شود که در سال ۲۰۲۶، ۱۴ میلیارد دلار ضرر کند. اما یکی از چیزهایی که لازم نیست نگران آن باشد، قرار دادن تبلیغات در نتایج جستجوی خود مانند گوگل است.

مانند گوگل، ChatGPT اطلاعات را از ناشران وب جمع‌آوری می‌کند، آن‌ها را خلاصه می‌کند و در پاسخ‌های خود می‌گنجاند. اما همچنین قراردادهای مالی با ناشران بسته است، پرداختی برای ارائه اطلاعاتی که در نتایج آن گنجانده می‌شود. (MIT Technology Review در مورد قراردادهای ناشران با OpenAI، گوگل، Perplexity و دیگران در حال مذاکره بوده است اما وارد هیچ توافقی نشده است. بخش تحریریه نه طرف این مذاکرات بوده و نه از محتوای آن‌ها مطلع بوده است.)

اما مسئله این است که برای این که جستجوی وب به آنچه OpenAI می‌خواهد برسد — به‌روزتر از مدل زبانی — همچنین باید اطلاعات را از انواع ناشران و منابعی که با آن‌ها قرارداد ندارد، جمع‌آوری کند. وارون شتی، رئیس مشارکت‌های رسانه‌ای OpenAI، به MIT Technology Review گفت که به شرکای ناشری خود ترجیح نمی‌دهد.

در عوض، OpenAI به من گفت که مدل خود معتبرترین و مفیدترین منبع را برای هر سوالی پیدا می‌کند. و این نیز می‌تواند عجیب باشد. در همان اولین مثالی که به من نشان داد — وقتی تورلی آن جستجوی نام را انجام داد — داستانی را که سال‌ها پیش برای Wired درباره هک شدن نوشته‌بودم، توصیف کرد. آن داستان همچنان یکی از پرخواننده‌ترین داستان‌هایی است که تا به حال نوشته‌ام. اما ChatGPT به آن لینک نداد. به یک بازنویسی کوتاه از The Verge لینک داد. مسلماً، این در یک نسخه نمونه اولیه از جستجو بود، که همانطور که تورلی گفت، "پرخطر" بود.

وقتی از او درباره آن پرسیدم، او واقعاً نمی‌توانست توضیح دهد که چرا مدل منابعی را که انتخاب کرده بود، انتخاب کرده است، زیرا مدل خود آن ارزیابی را انجام می‌دهد. شرکت با شناسایی — گاهی اوقات با کمک کاربران — آنچه پاسخ‌های بهتر می‌داند، به هدایت آن کمک می‌کند، اما مدل در واقع آن‌ها را انتخاب می‌کند.

تورلی گفت: "و در بسیاری از موارد، آن اشتباه می‌کند، به همین دلیل است که ما کارهایی برای انجام داریم. داشتن یک مدل در حلقه یک مکانیسم بسیار، بسیار متفاوت از نحوه عملکرد یک موتور جستجو در گذشته است."

در واقع!

مدل، چه GPT-4o از OpenAI باشد، چه Gemini از گوگل یا Claude از Anthropic، می‌تواند در توضیح چیزها بسیار، بسیار خوب باشد. اما منطق پشت توضیحات آن، دلایل آن برای انتخاب یک منبع خاص، و حتی زبانی که ممکن است در یک پاسخ استفاده کند، همه بسیار مرموز هستند. مطمئناً، یک مدل می‌تواند بسیار چیزها را توضیح دهد، اما وقتی به پاسخ‌های خود می‌رسد، نه.

تقریباً یک دهه پیش، در سال ۲۰۱۶، پیچای نوشت که گوگل از "موبایل اول" به "هوش مصنوعی اول" حرکت می‌کند: "اما در ۱۰ سال آینده، ما به دنیایی منتقل خواهیم شد که هوش مصنوعی اول است، دنیایی که در آن محاسبات به طور جهانی در دسترس قرار می‌گیرند — چه در خانه، چه در محل کار، در ماشین، یا در حال حرکت — و تعامل با همه این سطوح بسیار طبیعی‌تر و شهودی‌تر، و بالاتر از همه، هوشمندتر می‌شود."

اکنون به آنجا رسیده‌ایم — به نوعی. و این یک جای عجیب است. قرار است عجیب‌تر شود. این به ویژه زمانی صادق است که این چیزهایی که اکنون به عنوان متمایز می‌شناسیم — پرس‌و‌جو از یک موتور جستجو، تحریک یک مدل، جستجوی عکسی که گرفته‌ایم، تصمیم‌گیری درباره آنچه می‌خواهیم بخوانیم یا تماشا کنیم یا بشنویم، درخواست عکسی که آرزو می‌کنیم گرفته بودیم، و نگرفته‌ایم، اما هنوز هم می‌خواهیم ببینیم — شروع به ادغام کنند.

نتایج جستجویی که از هوش مصنوعی تولیدی می‌بینیم بهتر است به عنوان یک نقطه راهنما درک شوند تا یک مقصد. آنچه مهم‌تر است ممکن است خود جستجو نباشد؛ بلکه این است که جستجو به توسعه‌دهندگان مدل‌های هوش مصنوعی راهی برای گنجاندن اطلاعات بلادرنگ در ورودی‌ها و خروجی‌های آن‌ها داده است. و این همه نوع امکان‌ها را باز می‌کند.

ویل از OpenAI می‌گوید: "یک ChatGPT که بتواند وب را درک کند و به آن دسترسی داشته باشد، فقط درباره خلاصه‌سازی نتایج نخواهد بود. ممکن است درباره انجام کارها برای شما باشد. و فکر می‌کنم آینده‌ای بسیار هیجان‌انگیز در آنجا وجود دارد. شما می‌توانید تصور کنید که مدل برای شما یک پرواز رزرو کند، یا DoorDash سفارش دهد، یا فقط کارهای کلی را در آینده برای شما انجام دهد. فقط زمانی که مدل نحوه استفاده از اینترنت را درک کند، آسمان حد است."

این آینده عاملی است که مدتی است درباره آن می‌شنویم، و هرچه مدل‌های هوش مصنوعی بیشتر از داده‌های بلادرنگ اینترنت استفاده می‌کنند، به آن نزدیک‌تر می‌شویم.

فرض کنید چند هفته دیگر یک سفر در پیش دارید. یک عامل که می‌تواند داده‌ها را از اینترنت به صورت بلادرنگ دریافت کند، می‌تواند پروازها و هتل‌های شما را رزرو کند، رزرو شام انجام دهد، و بیشتر، بر اساس آنچه درباره شما و سفر آینده‌تان می‌داند — همه این‌ها بدون این که شما مجبور باشید آن را هدایت کنید. یک عامل دیگر می‌تواند، مثلاً، خروجی فاضلاب خانه شما را برای بیماری‌های خاص نظارت کند، و آزمایش‌ها و درمان‌ها را در پاسخ سفارش دهد. شما مجبور نخواهید بود که برای آن صدای عجیب ماشین‌تان جستجو کنید، زیرا عامل در وسیله نقلیه شما قبلاً این کار را انجام داده و قرار ملاقاتی برای رفع مشکل تنظیم کرده است.

پیچای می‌گوید: "همیشه فقط انجام جستجو و دادن پاسخ نخواهد بود. گاهی اوقات اقدامات خواهد بود. گاهی اوقات شما در دنیای واقعی در تعامل خواهید بود. بنابراین یک مفهوم از کمک جهانی در تمام این‌ها وجود دارد."

و روش‌هایی که این چیزها قادر خواهند بود پاسخ‌ها را ارائه دهند نیز اکنون به سرعت در حال تکامل هستند. به عنوان مثال، امروز گوگل نه تنها می‌تواند متن، تصاویر، و حتی ویدیو را جستجو کند؛ می‌تواند آن‌ها را ایجاد کند. تصور کنید که این توانایی را با جستجو در طیف وسیعی از فرمت‌ها و دستگاه‌ها ترکیب کنید. "به من نشان بده که یک پرنده warbler Townsend در درخت مقابل من چگونه به نظر می‌رسد." یا "از عکس‌ها و ویدیوهای خانوادگی موجود من استفاده کن تا یک تریلر فیلم از تعطیلات آینده‌مان به پورتوریکو در سال آینده ایجاد کنی، مطمئن شو که از همه بهترین رستوران‌ها و برجسته‌ترین نشانه‌ها دیدن می‌کنیم."

او می‌گوید: "ما عمدتاً آن را در سمت ورودی انجام داده‌ایم،" و به روش‌هایی اشاره می‌کند که گوگل اکنون می‌تواند یک تصویر یا درون یک ویدیو جستجو کند. "اما شما می‌توانید آن را در سمت خروجی نیز تصور کنید."

این نوع آینده‌ای است که پیچای می‌گوید مشتاق است آن را آنلاین کند. گوگل قبلاً کمی از آنچه ممکن است به نظر برسد را با NotebookLM نشان داده است، ابزاری که به شما اجازه می‌دهد مقادیر زیادی متن آپلود کنید و آن را به یک پادکست گویا تبدیل کنید. او تصور می‌کند که این نوع عملکرد — توانایی گرفتن یک نوع ورودی و تبدیل آن به انواع مختلف خروجی — نحوه تعامل ما با اطلاعات را دگرگون کند.

در یک نمایش از ابزاری به نام Project Astra در کنفرانس توسعه‌دهندگان گوگل این تابستان، این شرکت یک نسخه از این نتیجه را نشان داد، جایی که دوربین‌ها و میکروفون‌ها در تلفن‌ها و عینک‌های هوشمند زمینه اطراف شما — آنلاین و آفلاین، صوتی و تصویری — را درک می‌کنند و توانایی یادآوری و پاسخ در انواع مختلف را دارند. Astra می‌تواند، به عنوان مثال، به یک طراحی خام از یک ماشین مسابقه فرمول یک نگاه کند و نه تنها آن را شناسایی کند، بلکه قسمت‌های مختلف و کاربردهای آن را نیز توضیح دهد.

اما شما می‌توانید تصور کنید که چیزها کمی فراتر بروند (و خواهند رفت). فرض کنید می‌خواهم ویدیویی ببینم که چگونه چیزی را روی دوچرخه‌ام تعمیر کنم. ویدیو وجود ندارد، اما اطلاعات وجود دارد. جستجوی تولیدی مبتنی بر هوش مصنوعی می‌تواند به طور نظری آن اطلاعات را در جایی از اینترنت — مثلاً در یک راهنمای کاربر دفن شده در وب‌سایت یک شرکت — پیدا کند و یک ویدیو ایجاد کند تا دقیقاً به من نشان دهد که چگونه آنچه می‌خواهم انجام دهم، همانطور که امروز می‌تواند آن را با کلمات توضیح دهد.

این نوع چیزهایی است که وقتی کل مجموعه دانش بشری — دانشی که قبلاً در انبارهای زبان و فرمت؛ نقشه‌ها و ثبت‌های کسب‌و‌کار و SKUهای محصول؛ صدا و ویدیو و پایگاه‌های داده اعداد و کتاب‌های قدیمی و تصاویر و واقعاً هر چیزی که تا به حال منتشر شده، ردیابی شده، ضبط شده؛ چیزهایی که همین حالا در حال اتفاق افتادن هستند، همه جا — و یک مدل را در تمام آن معرفی کنید، شروع به اتفاق افتادن می‌کند. مدلی که شاید نتواند دقیقاً درک کند، اما توانایی کنار هم قرار دادن آن اطلاعات، بازآرایی آن، و بیرون ریختن آن به انواع مختلف امیدوارم روش‌های مفید را دارد. روش‌هایی که یک ایندکس صرف نمی‌توانست.

این چیزی است که ما در آستانه آن هستیم، و شروع به دیدن آن کرده‌ایم. و همانطور که گوگل این را به یک میلیارد نفر عرضه می‌کند، بسیاری از آن‌ها برای اولین بار با یک هوش مصنوعی مکالمه‌ای تعامل خواهند داشت، این چه معنایی خواهد داشت؟ چه کار متفاوتی انجام خواهیم داد؟ همه چیز به سرعت در حال تغییر است. صبر کنید، فقط صبر کنید.


Credit: "AI means the end of internet search as we’ve known it” By Mat Honan. published in MIT Technology Review.

Read the full article here: https://www.technologyreview.com/2025/01/06/1108679/ai-generative-search-internet-breakthroughs/