هوش مصنوعی، پایانی بر جستجوی اینترنتی به شکلی که میشناختیم

هوش مصنوعی به معنای پایان جستجوی اینترنتی است که تاکنون میشناختیم. همه ما با اصطلاح "گوگل کردن" آشنا هستیم: چند کلمه کلیدی را در کادر جستجو وارد میکنیم و در ازای آن، لیستی از لینکهای آبی به مرتبطترین نتایج دریافت میکنیم. شاید توضیحات مختصری در بالا، یا نقشهها، امتیازات ورزشی یا یک ویدیو هم نمایش داده شود. اما در نهایت، این فرآیند فقط بازیابی اطلاعاتی است که از قبل در اینترنت وجود دارد و به شکلی ساختارمند به ما نشان داده میشود.
اما همه اینها در حال تغییر است. ما در یک نقطه عطف جدید قرار داریم. بزرگترین تحول در نحوه ارائه اطلاعات توسط موتورهای جستجو از دهه ۱۹۹۰ تاکنون، همین حالا در حال وقوع است. دیگر خبری از جستجوی کلیدواژهها نیست. دیگر نیازی به کلیک کردن و مرور لینکها نیست. در عوض، وارد عصر جستجوی مکالمهای شدهایم. به این معنا که به جای استفاده از کلیدواژهها، سوالات واقعی و به زبان طبیعی میپرسیم و به جای لینکها، پاسخهایی دریافت میکنیم که توسط هوش مصنوعی تولید شدهاند و بر اساس اطلاعات زنده از سراسر اینترنت ارائه میشوند.
گوگل، شرکتی که در ۲۵ سال گذشته جستجو را تعریف کرده، تلاش میکند در این زمینه پیشرو باشد. در مه ۲۰۲۳، این شرکت شروع به آزمایش پاسخهای تولیدشده توسط هوش مصنوعی به جستجوها کرد و از مدل زبانی بزرگ خود (LLM) برای ارائه پاسخهایی استفاده کرد که شبیه به پاسخهای یک منبع متخصص یا دوست مورد اعتماد هستند. گوگل این پاسخها را "مرورهای هوش مصنوعی" نامیده است. ساندار پیچای، مدیرعامل گوگل، این تغییر را به MIT Technology Review به عنوان "یکی از مثبتترین تغییرات ما در جستجو در طول زمان طولانی" توصیف کرد.
مرورهای هوش مصنوعی به طور اساسی نوع سوالاتی که گوگل میتواند به آنها پاسخ دهد را تغییر میدهند. مثلاً میتوانید بپرسید: "ماه آینده به مدت یک هفته به ژاپن میروم. در توکیو اقامت خواهم داشت اما میخواهم چند سفر یک روزه انجام دهم. آیا جشنوارههایی در نزدیکی برگزار میشود؟ شرایط موجسواری در کاماکورا چگونه خواهد بود؟ آیا گروههای موسیقی خوبی در حال اجرا هستند؟" و یک پاسخ کامل دریافت خواهید کرد — نه فقط یک لینک به ردیت، بلکه یک پاسخ جامع با نتایج بهروز.
مهمتر این که، اکنون میتوانید جستجوهایی انجام دهید که قبلاً تقریباً غیرممکن بود و پاسخ درست دریافت کنید. لازم نیست دقیقاً بدانید که به دنبال چه چیزی هستید. میتوانید توصیف کنید که پرندهای در حیاط شما چگونه به نظر میرسد، یا مشکلی که با یخچال شما وجود دارد چیست، یا آن صدای عجیبی که ماشین شما تولید میکند، و یک توضیح تقریباً انسانی دریافت کنید که از منابع مختلف اینترنت گردآوری شده است. این شگفتانگیز است و وقتی شروع به جستجو به این روش کنید، اعتیادآور خواهد بود.
اما این فقط گوگل نیست. ChatGPT شرکت OpenAI اکنون به اینترنت دسترسی دارد و در یافتن پاسخهای بهروز به سوالات شما بسیار بهتر عمل میکند. مایکروسافت در سپتامبر نتایج جستجوی تولیدی را برای Bing منتشر کرد. متا نیز نسخه خود را دارد. استارتآپ Perplexity هم همین کار را انجام میدهد، اما با رویکرد "سریع حرکت کن، چیزها را خراب کن". تریلیونها دلار در این رقابت در خطر است، زیرا این شرکتها تلاش میکنند تا منبع بعدی بازیابی اطلاعات — گوگل بعدی — شوند.
اما همه از این تغییر خوشحال نیستند. ناشران کاملاً نگران هستند. این تغییر ترس از آیندهای بدون کلیک (zero-click) را افزایش داده است، جایی که ترافیک ارجاعی جستجو — که از قبل از وجود گوگل نیز پایه اصلی وب بوده است — از بین میرود.
من تصویری از آن آینده را در ژوئن گذشته دیدم، زمانی که یک اعلان از برنامه Perplexity روی تلفنم دریافت کردم. Perplexity یک استارتآپ است که تلاش میکند جستجوی وب را دوباره اختراع کند. اما علاوه بر ارائه پاسخهای عمیق به سوالات، این برنامه مقالات کامل درباره اخبار روز ایجاد میکند که توسط هوش مصنوعی از منابع مختلف گردآوری شدهاند.
در آن روز، این برنامه داستانی درباره یک شرکت جدید پهپادی از اریک اشمیت به من کرد. من این داستان را شناختم. فوربس آن را به طور انحصاری در همان هفته گزارش کرده بود، اما پشت دیوار پرداخت قفل شده بود. تصویر در داستان Perplexity دقیقاً شبیه به تصویر فوربس بود. زبان و ساختار نیز بسیار مشابه بود. این اساساً همان داستان بود، اما به طور رایگان در دسترس هر کسی در اینترنت قرار داشت. من به دوستی که داستان اصلی را ویرایش کرده بود پیام دادم تا بپرسم آیا فوربس قراردادی با این استارتآپ برای بازنشر محتوای خود دارد یا خیر. اما هیچ قراردادی وجود نداشت. او شوکه و عصبانی بود و خوب، سردرگم. او تنها نبود. فوربس، نیویورک تایمز و Condé Nast همگی اخطارهای توقف و خودداری به این شرکت ارسال کردهاند. نیوز کورپ نیز برای خسارات شکایت کرده است.
مردم نگران هستند که این نتایج جدید مبتنی بر مدلهای زبانی بزرگ (LLM) چه معنایی برای واقعیت مشترک ما خواهد داشت. این ممکن است به معنای پایان پاسخهای استاندارد و معتبر باشد.
این دقیقاً سناریوی کابوسواری بود که ناشران از آن میترسیدند: هوش مصنوعی محتوای ارزشمند آنها را جمعآوری میکرد، دوباره بستهبندی میکرد و به مخاطبان خود ارائه میداد، به گونهای که دیگر هیچ دلیلی برای کلیک کردن و رفتن به منبع اصلی باقی نمیگذاشت. در واقع، در صفحه "درباره" Perplexity، اولین دلیلی که برای انتخاب این موتور جستجو ذکر شده است، "رد شدن از لینکها" است.
اما این فقط مربوط به ناشران نیست. مردم همچنین نگران هستند که این نتایج جدید مبتنی بر مدلهای زبانی بزرگ چه معنایی برای واقعیت مشترک ما خواهد داشت. مدلهای زبانی تمایل دارند چیزهایی را از خود بسازند — آنها میتوانند چرندیات را توهم کنند. علاوه بر این، هوش مصنوعی تولیدی میتواند هر بار پاسخ کاملاً جدیدی به همان سوال ارائه دهد، یا پاسخهای متفاوتی به افراد مختلف بر اساس آنچه درباره آنها میداند، بدهد. این ممکن است به معنای پایان پاسخهای استاندارد و معتبر باشد.
اما اشتباه نکنید: این آینده جستجو است. خودتان آن را امتحان کنید و خواهید دید.
البته، ما همیشه میخواهیم از موتورهای جستجو برای پیمایش وب و کشف منابع جدید و جالب اطلاعات استفاده کنیم. اما لینکها به حاشیه رانده شدهاند. نحوهای که هوش مصنوعی میتواند یک پاسخ منطقی به تقریباً هر نوع سوالی بدهد، با استفاده از دادههای زنده از سراسر وب، تجربه بهتری ارائه میدهد. این موضوع به ویژه در مقایسه با آنچه جستجوی وب در سالهای اخیر تبدیل شده است، صادق است. اگر نگوییم کاملاً خراب است (دادهها نشان میدهند که افراد بیشتری از همیشه از گوگل استفاده میکنند)، حداقل به طور فزایندهای شلوغ و دلهرهآور شده است.
چه کسی میخواهد مجبور باشد زبان موتورهای جستجو را صحبت کند تا آنچه نیاز دارد را پیدا کند؟ چه کسی میخواهد لینکها را مرور کند وقتی میتواند پاسخهای مستقیم دریافت کند؟ و شاید: چه کسی میخواهد مجبور باشد یاد بگیرد وقتی میتواند فقط بداند؟
در ابتدا Archie بود. این اولین موتور جستجوی واقعی اینترنت بود که فایلهایی را که قبلاً در تاریکی سرورهای دورافتاده پنهان شده بودند، کرال میکرد. به شما نمیگفت که در آن فایلها چیست — فقط نام آنها را نشان میداد. تصاویر را پیشنمایش نمیکرد؛ هیچ سلسلهمراتبی از نتایج نداشت، یا حتی رابط کاربری چندانی نداشت. اما یک شروع بود. و نسبتاً خوب بود.
سپس تیم برنرز-لی وب جهانی را ایجاد کرد و انواع صفحات وب پدید آمدند. صفحه اصلی موزاییک، پایگاه داده اینترنتی فیلمها، Geocities، رقص همستر، حلقههای وب، Salon، eBay، CNN، سایتهای دولت فدرال و صفحه اصلی یک نفر در ترکیه.
تا این که در نهایت، وب آنقدر بزرگ شد که حتی نمیدانستیم از کجا شروع کنیم. واقعاً به راه بهتری برای پیمایش و پیدا کردن چیزهایی که نیاز داشتیم، نیاز داشتیم.
و بنابراین در سال ۱۹۹۴ جری یانگ یاهو را ایجاد کرد، یک دایرکتوری سلسلهمراتبی از وبسایتها. این به سرعت به صفحه اصلی میلیونها نفر تبدیل شد. و خوب … قابل قبول بود. با توجه به گذشته، فکر میکنم همه ما فکر میکردیم که آن زمان خیلی بهتر از چیزی بود که واقعاً بود.
اما وب همچنان به رشد و گسترش خود ادامه داد و هر روز اطلاعات بیشتری به صورت آنلاین قرار میگرفت. به جای فقط یک لیست از سایتها بر اساس دستهبندی، به چیزی نیاز داشتیم که واقعاً به همه آن محتوا نگاه کند و آن را فهرستبندی کند. تا اواخر دهه ۹۰، این به معنای انتخاب از بین انواع موتورهای جستجو بود: AltaVista، AlltheWeb، WebCrawler و HotBot. و آنها خوب بودند — یک پیشرفت بزرگ. حداقل در ابتدا.
اما همراه با ظهور موتورهای جستجو، اولین تلاشها برای سوء استفاده از توانایی آنها در ارائه ترافیک نیز آغاز شد. ترافیک ارزشمند و گرانبها، که ناشران وب برای فروش تبلیغات به آن متکی هستند و خردهفروشان از آن برای جلب توجه به محصولات خود استفاده میکنند. گاهی اوقات این به معنای پر کردن صفحات با کلیدواژهها یا متنهای بیمعنی بود که صرفاً برای بالا بردن صفحات در نتایج جستجو طراحی شده بودند. این وضعیت به حدی بد شد.
و سپس گوگل آمد. سخت است که انقلابی بودن گوگل را زمانی که در سال ۱۹۹۸ راهاندازی شد، بیش از حد بزرگ جلوه دهیم. به جای فقط اسکن محتوا، به منابعی که به یک وبسایت لینک میدادند نیز نگاه میکرد، که به ارزیابی مرتبط بودن آن کمک میکرد. برای سادهگویی: هرچه چیزی در جای دیگری بیشتر ذکر میشد، گوگل آن را قابل اعتمادتر میدانست و در نتایج بالاتر نشان میداد. این پیشرفت گوگل را به طور چشمگیری بهتر از هر چیزی که قبلاً وجود داشت، در بازیابی نتایج مرتبط کرد. این شگفتانگیز بود.
برای ۲۵ سال، گوگل بر جستجو مسلط بود. گوگل برای اکثر مردم، جستجو بود. (میزان این تسلط در حال حاضر موضوع چندین بررسی قانونی در ایالات متحده و اتحادیه اروپا است.)
اما گوگل مدتهاست که از ارائه صرف یک سری لینک آبی فاصله گرفته است، همانطور که پاندو نایاک، دانشمند ارشد جستجوی گوگل، اشاره میکند.
او میگوید: "این فقط نتایج به اصطلاح وب نیست، بلکه تصاویر و ویدیوها، و چیزهای خاص برای اخبار نیز وجود دارد. پاسخهای مستقیم، پاسخهای فرهنگ لغت، ورزش، پاسخهایی که با گراف دانش همراه هستند، چیزهایی مانند قطعات برجسته." او فهرستی از اقدامات گوگل در طول سالها برای پاسخ مستقیمتر به سوالات را برمیشمارد.
درست است: گوگل در طول زمان تکامل یافته و بیشتر به یک پورتال پاسخ تبدیل شده است. ابزارهایی اضافه کرده است که به مردم اجازه میدهد فقط یک پاسخ دریافت کنند — امتیاز زنده یک بازی، ساعات باز بودن یک کافه، یا یک قطعه از وبسایت FDA — به جای این که به یک وبسایت هدایت شوند که ممکن است پاسخ در آن باشد.
اما وقتی کمی از مرورهای هوش مصنوعی استفاده کنید، متوجه میشوید که آنها متفاوت هستند.
به عنوان مثال، قطعات برجسته، بخشهایی که گوگل گاهی اوقات انتخاب میکند تا در بالای نتایج نشان دهد. آن کلمات مستقیماً از یک منبع اصلی نقل شدهاند. همین موضوع در مورد پنلهای دانش نیز صادق است، که از اطلاعات ذخیره شده در طیف وسیعی از پایگاههای داده عمومی و گراف دانش گوگل، پایگاه دادهای با تریلیونها واقعیت درباره جهان، تولید میشوند.
در حالی که اینها میتوانند نادرست باشند، منبع اطلاعات قابل شناسایی (و قابل اصلاح) است. در یک پایگاه داده است. میتوانید آن را جستجو کنید. اما دیگر اینطور نیست: مرورهای هوش مصنوعی میتوانند هر بار کاملاً جدید باشند، به صورت لحظهای توسط متن پیشبینیکننده یک مدل زبانی و یک ایندکس از وب تولید شوند.
پیچای به MIT Technology Review گفت: "فکر میکنم این یک لحظه هیجانانگیز است که ما به وضوح جهان را فهرستبندی کردهایم. ما درک عمیقی بر اساس آن با گراف دانش ساختهایم. ما از مدلهای زبانی بزرگ و هوش مصنوعی تولیدی برای بهبود درک خود از همه اینها استفاده کردهایم. اما اکنون میتوانیم با آن تولید و ترکیب کنیم."
نتیجه بیشتر شبیه به پرسیدن از یک دوست بسیار باهوش و کتابخوان است تا پرسوجو از یک پایگاه داده. (با این نکته که این دوست گاهی اوقات اگر پاسخ را نداند، چیزهایی را از خود میسازد.)
لیز رید، رئیس بخش جستجوی گوگل، از مقر این شرکت در مانتین ویو، کالیفرنیا به من میگوید: "ماموریت [شرکت] سازماندهی اطلاعات جهان است. اما در واقع، برای مدتی کاری که ما انجام میدادیم سازماندهی صفحات وب بود. که واقعاً همان سازماندهی اطلاعات جهان یا قابل استفاده و در دسترس قرار دادن آن برای شما نیست."
این مفهوم دوم — دسترسی — چیزی است که گوگل واقعاً با مرورهای هوش مصنوعی روی آن تمرکز کرده است. این احساسی است که من بارها در گفتوگو با مدیران گوگل شنیدهام: آنها میتوانند انواع پیچیدهتر سوالات را با کارایی بیشتری با استفاده از یک مدل زبانی برای کمک به ارائه پاسخها، پاسخ دهند. و میتوانند این کار را به زبان طبیعی انجام دهند.
این برای آیندهای که جستجو فراتر از پرسوجوهای متنی میرود، حتی مهمتر خواهد بود. به عنوان مثال، Google Lens که به مردم اجازه میدهد عکس بگیرند یا تصویری را آپلود کنند تا اطلاعات بیشتری درباره چیزی به دست آورند، از پاسخهای تولیدشده توسط هوش مصنوعی استفاده میکند تا به شما بگوید ممکن است به چه چیزی نگاه کنید. گوگل حتی توانایی پرسوجو از ویدیوی زنده را نیز نمایش داده است.
وقتی پاسخی ندارد، یک مدل هوش مصنوعی میتواند با اطمینان پاسخهایی را بیرون بریزد. برای گوگل، این میتواند یک مشکل واقعی باشد. برای بقیه ما، این میتواند واقعاً خطرناک باشد.
پیچای میگوید: "ما قطعاً در ابتدای یک سفر هستیم که در آن مردم قادر خواهند بود سوالات بسیار پیچیدهتری بپرسند و پاسخ دریافت کنند نسبت به آنچه در دهه گذشته بوده است."
در اینجا برخی خطرات واقعی وجود دارد. اول از همه: مدلهای زبانی بزرگ به شما دروغ میگویند. آنها توهم میکنند. آنها اشتباه میکنند. وقتی پاسخی ندارند، یک مدل هوش مصنوعی میتواند با بیخیالی و اطمینان پاسخهایی را بیرون بریزد. برای گوگل، که در ۲۰ سال گذشته اعتبار خود را بر پایه قابلیت اطمینان بنا کرده است، این میتواند یک مشکل واقعی باشد. برای بقیه ما، این میتواند واقعاً خطرناک باشد.
در مه ۲۰۲۴، مرورهای هوش مصنوعی برای همه در ایالات متحده راهاندازی شد. اوضاع خوب پیش نرفت. گوگل، که مدتها میز مرجع جهان بود، به مردم گفت که سنگ بخورند و چسب روی پیتزای خود بگذارند. این پاسخها بیشتر در پاسخ به چیزی بود که شرکت آن را "پرسوجوهای خصمانه" مینامد — آنهایی که طراحی شدهاند تا آن را به دام بیندازند. اما باز هم. این خوب به نظر نمیرسید. شرکت به سرعت شروع به رفع مشکلات کرد — به عنوان مثال، با حذف محتوای تولیدشده توسط کاربر از سایتهایی مانند ردیت، که برخی از پاسخهای عجیب از آنجا آمده بودند.
با این حال، در حالی که اشتباهات آن در گفتن به مردم که سنگ بخورند همه توجهها را به خود جلب کرد، خطر موذیتر ممکن است زمانی رخ دهد که چیزی کمتر آشکارا اشتباه میگوید. به عنوان مثال، در انجام تحقیقات برای این مقاله، از گوگل پرسیدم که MIT Technology Review چه زمانی آنلاین شد. این پاسخ مفیدی داد که "MIT Technology Review حضور آنلاین خود را در اواخر سال ۲۰۲۲ راهاندازی کرد." این برای من به وضوح اشتباه بود، اما برای کسی که کاملاً با این نشریه آشنا نبود، آیا این اشتباه آشکار میشد؟
من چندین مثال مانند این را هم در گوگل و هم در جستجوی ChatGPT شرکت OpenAI دیدم. چیزهایی که به اندازهای از هدف دور هستند که بلافاصله به عنوان اشتباه دیده نشوند. گوگل امیدوار است که با تکیه بر آنچه درباره منابع باکیفیت میداند، بتواند به مرور زمان این نتایج را بهبود بخشد.
نایاک میگوید: "وقتی مرورهای هوش مصنوعی تولید میکنیم، به دنبال اطلاعات تأییدکننده از نتایج جستجو هستیم، و خود نتایج جستجو طوری طراحی شدهاند که تا حد امکان از این منابع قابل اعتماد باشند. اینها برخی از مکانیسمهایی هستند که ما داریم تا اطمینان حاصل کنیم که اگر فقط مرور هوش مصنوعی را مصرف کنید، و نخواهید بیشتر جستجو کنید … امیدواریم که همچنان یک پاسخ قابل اعتماد و معتبر دریافت کنید."
در مورد بالا، پاسخ سال ۲۰۲۲ ظاهراً از یک منبع قابل اعتماد آمده بود — داستانی درباره خبرنامههای ایمیلی MIT Technology Review، که در سال ۲۰۲۲ راهاندازی شدند. اما ماشین اساساً سوء تفاهم کرده بود. این یکی از دلایلی است که گوگل از انسانها — ارزیابها — برای ارزیابی دقت نتایجی که ارائه میدهد، استفاده میکند. ارزیابیها مرورهای هوش مصنوعی فردی را اصلاح یا کنترل نمیکنند؛ بلکه به آموزش مدل برای ساخت پاسخهای بهتر کمک میکنند. اما ارزیابهای انسانی میتوانند خطا کنند. گوگل روی این موضوع نیز کار میکند.
نایاک میگوید: "ارزیابهایی که به آزمایشهای شما نگاه میکنند ممکن است متوجه توهم نشوند، زیرا به نوعی طبیعی به نظر میرسد. و بنابراین شما واقعاً باید روی تنظیمات ارزیابی کار کنید تا مطمئن شوید که وقتی توهمی وجود دارد، کسی بتواند اشاره کند و بگوید، این یک مشکل است."
موتور جستجو
گوگل
این غول جستجو مرورهای هوش مصنوعی را به نتایج جستجو اضافه کرده است. این مرورها اطلاعات را از سراسر وب و گراف دانش گوگل جمعآوری میکنند و از مدل زبانی Gemini شرکت برای ایجاد پاسخها به جستجوها استفاده میکنند.
چیزی که در آن خوب است
مرورهای هوش مصنوعی گوگل در ارائه یک خلاصه قابل هضم در پاسخ به حتی پیچیدهترین سوالات عالی هستند، با جعبههای منبع در کنار پاسخها. در میان گزینههای اصلی، ایندکس عمیق وب آن بیشترین حس "اینترنتی" را دارد. اما ناشران وب نگران هستند که خلاصههای آنها دلیلی برای کلیک کردن و رفتن به منبع اصلی باقی نگذارد.
Perplexity
Perplexity یک موتور جستجوی مکالمهای است که از مدلهای زبانی بزرگ شخص ثالث از OpenAI و Anthropic برای پاسخ به سوالات استفاده میکند.
Perplexity در گردآوری جستجوهای عمیق در پاسخ به سوالات کاربران عالی است، پاسخهایی تولید میکند که مانند مقالات سفید کوچک در مورد موضوعات پیچیده هستند. همچنین در خلاصهسازی رویدادهای جاری عالی است. اما با ناشران بد شده است، که میگویند با محتوای آنها سریع و بیپروا برخورد میکند.
ChatGPT
در حالی که گوگل هوش مصنوعی را به جستجو آورد، OpenAI جستجو را به ChatGPT آورد. سوالاتی که مدل تشخیص میدهد از یک جستجوی وب بهرهمند میشوند، به طور خودکار یک جستجوی وب را فعال میکنند، یا کاربران میتوانند به صورت دستی گزینه اضافه کردن یک جستجوی وب را انتخاب کنند.
به لطف توانایی آن در حفظ زمینه در طول یک مکالمه، ChatGPT برای انجام جستجوهایی که از سوالات پیگیری بهرهمند میشوند — مانند برنامهریزی یک تعطیلات از طریق چندین جلسه جستجو — خوب کار میکند. OpenAI میگوید کاربران گاهی اوقات در تحقیق درباره سوالات "۲۰ دور عمیق" میروند. از بین این سه، این کمترین لینکها را به ناشران نشان میدهد.
وقتی با پیچای در این مورد صحبت کردم، او ابراز خوشبینی کرد درباره توانایی شرکت در حفظ دقت حتی با تولید پاسخها توسط مدل زبانی بزرگ. این به این دلیل است که مرورهای هوش مصنوعی بر اساس مدل زبانی بزرگ پرچمدار گوگل، Gemini، است اما همچنین از گراف دانش و منابع معتبر در سراسر وب استفاده میکند.
او میگوید: "شما همیشه با درصدها سر و کار دارید. کاری که ما انجام دادهایم این است که آن را در سطحی که من میگویم چند نه از اعتماد و واقعیت و کیفیت ارائه میدهیم. میگویم ۹۹ نقطه چند نه. فکر میکنم این معیاری است که ما با آن کار میکنیم، و این در مورد مرورهای هوش مصنوعی نیز صادق است. و بنابراین سوال این است که آیا ما قادریم این کار را دوباره در مقیاس انجام دهیم؟ و فکر میکنم هستیم."
با این حال، خطر دیگری نیز وجود دارد، و آن این است که مردم همه چیزهای عجیب و غریب را از گوگل میپرسند. اگر میخواهید darkest secrets کسی را بدانید، به تاریخچه جستجوی آنها نگاه کنید. گاهی اوقات چیزهایی که مردم از گوگل میپرسند بسیار تاریک هستند. گاهی اوقات غیرقانونی هستند. گوگل نه تنها باید بتواند مرورهای هوش مصنوعی خود را زمانی که یک پاسخ میتواند مفید باشد، مستقر کند؛ بلکه باید بسیار مراقب باشد که آنها را زمانی که یک پاسخ ممکن است مضر باشد، مستقر نکند.
رید میگوید: "اگر بروید و بگویید 'چگونه یک بمب بسازم؟' خوب است که نتایج وب وجود داشته باشد. این وب باز است. شما میتوانید به هر چیزی دسترسی داشته باشید. اما ما نیازی نداریم که یک مرور هوش مصنوعی داشته باشیم که به شما بگوید چگونه یک بمب بسازید، درست است؟ ما فقط فکر نمیکنیم که این ارزشش را داشته باشد."
اما شاید بزرگترین خطر — یا بزرگترین ناشناخته — برای هر کسی که در پاییندست یک جستجوی گوگل قرار دارد، باشد. به عنوان مثال، ناشران، که برای دههها به جستجوها متکی بودهاند تا مردم را به سمت آنها هدایت کنند. اگر تمام اطلاعاتی که به دنبال آن هستند در نتیجه جستجو وجود داشته باشد، چه دلیلی دارد که مردم به منبع اصلی کلیک کنند؟
رند فیشکین، همبنیانگذار شرکت تحقیقات بازار SparkToro، تحقیقاتی درباره جستجوهای بدون کلیک (zero-click) منتشر میکند. همانطور که گوگل بیشتر و بیشتر وارد کسبوکار پاسخ شده است، نسبت جستجوهایی که بدون کلیک پایان مییابند، افزایش یافته است. حس او این است که مرورهای هوش مصنوعی این روند را منفجر خواهند کرد.
او میگوید: "اگر شما به گوگل برای ترافیک متکی هستید، و آن ترافیک بود که کسبوکار شما را به جلو میبرد، شما در مشکل کوتاهمدت و بلندمدت هستید."
پیچای پیامش این است: وحشت نکنید. او استدلال میکند که حتی در عصر مرورهای هوش مصنوعی، مردم هنوز هم برای بسیاری از انواع جستجوها میخواهند کلیک کنند و عمیقتر بروند. او میگوید: "اصل زیربنایی این است که مردم برای اطلاعات میآیند. آنها همیشه به دنبال این نیستند که گوگل فقط پاسخ دهد. گاهی اوقات بله، اما اکثر اوقات، شما به آن به عنوان یک نقطه شروع نگاه میکنید."
رید، از سوی دیگر، استدلال میکند که چون مرورهای هوش مصنوعی به مردم اجازه میدهد سوالات پیچیدهتری بپرسند و بیشتر در آنچه میخواهند عمیق شوند، حتی میتوانند برای برخی انواع ناشران و کسبوکارهای کوچک مفید باشند، به ویژه آنهایی که در حوزههای تخصصی فعالیت میکنند: "شما اساساً به مخاطبان جدیدی دست مییابید، زیرا مردم اکنون میتوانند آنچه را که میخواهند به طور خاصتر بیان کنند، و بنابراین کسی که تخصص دارد نیازی ندارد برای پرسوجوی عمومی رتبهبندی شود."
"من با چیزی پرخطر شروع میکنم،" نیک تورلی از محدوده یک پنجره Zoom به من میگوید. تورلی رئیس محصول ChatGPT است، و چند هفته قبل از راهاندازی، ابزار جستجوی جدید OpenAI را به من نشان میدهد. او میگوید: "من معمولاً باید این را قبلاً امتحان میکردم، اما فقط میخواهم برای شما جستجو کنم. این همیشه یک دموی پرخطر است، زیرا مردم تمایل دارند درباره آنچه در اینترنت درباره آنها گفته میشود، حساس باشند."
او نام من را در یک فیلد جستجو تایپ میکند، و موتور جستجوی نمونه اولیه چند جمله بیرون میدهد، تقریباً مانند یک بیوگرافی سخنران. من و نقش فعلیام را به درستی شناسایی میکند. حتی داستانی که سالها پیش نوشتهام و احتمالاً شناختهشدهترین داستان من بود را برجسته میکند. به طور خلاصه، پاسخ درست است. خیالتان راحت باشد؟
چند هفته پس از تماس ما، OpenAI جستجو را در ChatGPT گنجاند، پاسخهای مدل زبانی خود را با اطلاعات از سراسر وب تکمیل کرد. اگر مدل تشخیص دهد که یک پاسخ از اطلاعات بهروز بهرهمند میشود، به طور خودکار یک جستجوی وب اجرا میکند (OpenAI نمیگوید شرکای جستجوی آن چه کسانی هستند) و آن پاسخها را در پاسخ خود میگنجاند، با لینکهایی به بیرون اگر بخواهید بیشتر بدانید. شما همچنین میتوانید به صورت دستی آن را مجبور کنید که وب را جستجو کند اگر به طور خودکار این کار را انجام ندهد. OpenAI فاش نمیکند که چند نفر از جستجوی وب آن استفاده میکنند، اما میگوید حدود ۲۵۰ میلیون نفر به طور هفتگی از ChatGPT استفاده میکنند، که همه آنها به طور بالقوه در معرض آن قرار دارند.
کوین ویل، مدیر ارشد محصول OpenAI، میگوید: "مقدار باورنکردنی محتوا در وب وجود دارد. چیزهای زیادی در زمان واقعی اتفاق میافتد. شما میخواهید ChatGPT بتواند از آن استفاده کند تا پاسخهای خود را بهبود بخشد و یک دستیار فوقالعاده بهتر برای شما باشد."
بر اساس گفتههای فیشکین، این اشکال جدیدتر جستجوی مبتنی بر هوش مصنوعی هنوز بر تسلط جستجوی گوگل چالش ایجاد نکردهاند. او میگوید: "به نظر نمیرسد که اینها در حال از بین بردن اشکال کلاسیک جستجوی وب باشند."
OpenAI اصرار دارد که واقعاً قصد رقابت در جستجو را ندارد — اگرچه صادقانه به نظر من این کمی مانند تنظیم انتظارات است. در عوض، میگوید جستجوی وب بیشتر وسیلهای است برای به دست آوردن اطلاعات بهروزتر از دادههای موجود در مدلهای آموزشی آن، که تمایل دارند تاریخهای قطع مشخصی داشته باشند که اغلب ماهها، یا حتی یک سال یا بیشتر، در گذشته هستند. در نتیجه، در حالی که ChatGPT ممکن است در توضیح نحوه عملکرد یک حمله ساحل غربی عالی باشد، مدتها در گفتن آخرین امتیاز 49ers بیفایده بوده است. دیگر نه.
ویل به من میگوید: "من از این دیدگاه به آن نگاه میکنم که 'چگونه میتوانیم ChatGPT را قادر سازیم تا به هر سوالی که دارید پاسخ دهد؟ چگونه میتوانیم آن را برای شما در زندگی روزمره مفیدتر کنیم؟' و این جایی است که جستجو برای ما وارد میشود. مقدار باورنکردنی محتوا در وب وجود دارد. چیزهای زیادی در زمان واقعی اتفاق میافتد. شما میخواهید ChatGPT بتواند از آن استفاده کند تا پاسخهای خود را بهبود بخشد و بتواند یک دستیار فوقالعاده بهتر برای شما باشد."
امروز ChatGPT قادر است پاسخهایی برای رویدادهای خبری بسیار جاری، و همچنین اطلاعات تقریباً بلادرنگ درباره چیزهایی مانند قیمت سهام تولید کند. و در حالی که رابط کاربری ChatGPT مدتهاست که خستهکننده بوده است، نتایج جستجو انواع مختلفی از چندرسانهها — تصاویر، نمودارها، حتی ویدیو — را به همراه میآورند. این یک تجربه بسیار متفاوت است.
ویل همچنین استدلال میکند که ChatGPT آزادی بیشتری برای نوآوری و رفتن به راه خود نسبت به رقبایی مانند گوگل — حتی بیشتر از شریک خود مایکروسافت با Bing — دارد. هر دوی آنها کسبوکارهای وابسته به تبلیغات هستند. OpenAI نیست. (حداقل هنوز نه.) درآمد خود را از توسعهدهندگان، کسبوکارها و افرادی که مستقیماً از آن استفاده میکنند، به دست میآورد. در حال حاضر بیشتر در حال سوزاندن مقادیر زیادی پول است — بر اساس برخی گزارشها، پیشبینی میشود که در سال ۲۰۲۶، ۱۴ میلیارد دلار ضرر کند. اما یکی از چیزهایی که لازم نیست نگران آن باشد، قرار دادن تبلیغات در نتایج جستجوی خود مانند گوگل است.
مانند گوگل، ChatGPT اطلاعات را از ناشران وب جمعآوری میکند، آنها را خلاصه میکند و در پاسخهای خود میگنجاند. اما همچنین قراردادهای مالی با ناشران بسته است، پرداختی برای ارائه اطلاعاتی که در نتایج آن گنجانده میشود. (MIT Technology Review در مورد قراردادهای ناشران با OpenAI، گوگل، Perplexity و دیگران در حال مذاکره بوده است اما وارد هیچ توافقی نشده است. بخش تحریریه نه طرف این مذاکرات بوده و نه از محتوای آنها مطلع بوده است.)
اما مسئله این است که برای این که جستجوی وب به آنچه OpenAI میخواهد برسد — بهروزتر از مدل زبانی — همچنین باید اطلاعات را از انواع ناشران و منابعی که با آنها قرارداد ندارد، جمعآوری کند. وارون شتی، رئیس مشارکتهای رسانهای OpenAI، به MIT Technology Review گفت که به شرکای ناشری خود ترجیح نمیدهد.
در عوض، OpenAI به من گفت که مدل خود معتبرترین و مفیدترین منبع را برای هر سوالی پیدا میکند. و این نیز میتواند عجیب باشد. در همان اولین مثالی که به من نشان داد — وقتی تورلی آن جستجوی نام را انجام داد — داستانی را که سالها پیش برای Wired درباره هک شدن نوشتهبودم، توصیف کرد. آن داستان همچنان یکی از پرخوانندهترین داستانهایی است که تا به حال نوشتهام. اما ChatGPT به آن لینک نداد. به یک بازنویسی کوتاه از The Verge لینک داد. مسلماً، این در یک نسخه نمونه اولیه از جستجو بود، که همانطور که تورلی گفت، "پرخطر" بود.
وقتی از او درباره آن پرسیدم، او واقعاً نمیتوانست توضیح دهد که چرا مدل منابعی را که انتخاب کرده بود، انتخاب کرده است، زیرا مدل خود آن ارزیابی را انجام میدهد. شرکت با شناسایی — گاهی اوقات با کمک کاربران — آنچه پاسخهای بهتر میداند، به هدایت آن کمک میکند، اما مدل در واقع آنها را انتخاب میکند.
تورلی گفت: "و در بسیاری از موارد، آن اشتباه میکند، به همین دلیل است که ما کارهایی برای انجام داریم. داشتن یک مدل در حلقه یک مکانیسم بسیار، بسیار متفاوت از نحوه عملکرد یک موتور جستجو در گذشته است."
در واقع!
مدل، چه GPT-4o از OpenAI باشد، چه Gemini از گوگل یا Claude از Anthropic، میتواند در توضیح چیزها بسیار، بسیار خوب باشد. اما منطق پشت توضیحات آن، دلایل آن برای انتخاب یک منبع خاص، و حتی زبانی که ممکن است در یک پاسخ استفاده کند، همه بسیار مرموز هستند. مطمئناً، یک مدل میتواند بسیار چیزها را توضیح دهد، اما وقتی به پاسخهای خود میرسد، نه.
تقریباً یک دهه پیش، در سال ۲۰۱۶، پیچای نوشت که گوگل از "موبایل اول" به "هوش مصنوعی اول" حرکت میکند: "اما در ۱۰ سال آینده، ما به دنیایی منتقل خواهیم شد که هوش مصنوعی اول است، دنیایی که در آن محاسبات به طور جهانی در دسترس قرار میگیرند — چه در خانه، چه در محل کار، در ماشین، یا در حال حرکت — و تعامل با همه این سطوح بسیار طبیعیتر و شهودیتر، و بالاتر از همه، هوشمندتر میشود."
اکنون به آنجا رسیدهایم — به نوعی. و این یک جای عجیب است. قرار است عجیبتر شود. این به ویژه زمانی صادق است که این چیزهایی که اکنون به عنوان متمایز میشناسیم — پرسوجو از یک موتور جستجو، تحریک یک مدل، جستجوی عکسی که گرفتهایم، تصمیمگیری درباره آنچه میخواهیم بخوانیم یا تماشا کنیم یا بشنویم، درخواست عکسی که آرزو میکنیم گرفته بودیم، و نگرفتهایم، اما هنوز هم میخواهیم ببینیم — شروع به ادغام کنند.
نتایج جستجویی که از هوش مصنوعی تولیدی میبینیم بهتر است به عنوان یک نقطه راهنما درک شوند تا یک مقصد. آنچه مهمتر است ممکن است خود جستجو نباشد؛ بلکه این است که جستجو به توسعهدهندگان مدلهای هوش مصنوعی راهی برای گنجاندن اطلاعات بلادرنگ در ورودیها و خروجیهای آنها داده است. و این همه نوع امکانها را باز میکند.
ویل از OpenAI میگوید: "یک ChatGPT که بتواند وب را درک کند و به آن دسترسی داشته باشد، فقط درباره خلاصهسازی نتایج نخواهد بود. ممکن است درباره انجام کارها برای شما باشد. و فکر میکنم آیندهای بسیار هیجانانگیز در آنجا وجود دارد. شما میتوانید تصور کنید که مدل برای شما یک پرواز رزرو کند، یا DoorDash سفارش دهد، یا فقط کارهای کلی را در آینده برای شما انجام دهد. فقط زمانی که مدل نحوه استفاده از اینترنت را درک کند، آسمان حد است."
این آینده عاملی است که مدتی است درباره آن میشنویم، و هرچه مدلهای هوش مصنوعی بیشتر از دادههای بلادرنگ اینترنت استفاده میکنند، به آن نزدیکتر میشویم.
فرض کنید چند هفته دیگر یک سفر در پیش دارید. یک عامل که میتواند دادهها را از اینترنت به صورت بلادرنگ دریافت کند، میتواند پروازها و هتلهای شما را رزرو کند، رزرو شام انجام دهد، و بیشتر، بر اساس آنچه درباره شما و سفر آیندهتان میداند — همه اینها بدون این که شما مجبور باشید آن را هدایت کنید. یک عامل دیگر میتواند، مثلاً، خروجی فاضلاب خانه شما را برای بیماریهای خاص نظارت کند، و آزمایشها و درمانها را در پاسخ سفارش دهد. شما مجبور نخواهید بود که برای آن صدای عجیب ماشینتان جستجو کنید، زیرا عامل در وسیله نقلیه شما قبلاً این کار را انجام داده و قرار ملاقاتی برای رفع مشکل تنظیم کرده است.
پیچای میگوید: "همیشه فقط انجام جستجو و دادن پاسخ نخواهد بود. گاهی اوقات اقدامات خواهد بود. گاهی اوقات شما در دنیای واقعی در تعامل خواهید بود. بنابراین یک مفهوم از کمک جهانی در تمام اینها وجود دارد."
و روشهایی که این چیزها قادر خواهند بود پاسخها را ارائه دهند نیز اکنون به سرعت در حال تکامل هستند. به عنوان مثال، امروز گوگل نه تنها میتواند متن، تصاویر، و حتی ویدیو را جستجو کند؛ میتواند آنها را ایجاد کند. تصور کنید که این توانایی را با جستجو در طیف وسیعی از فرمتها و دستگاهها ترکیب کنید. "به من نشان بده که یک پرنده warbler Townsend در درخت مقابل من چگونه به نظر میرسد." یا "از عکسها و ویدیوهای خانوادگی موجود من استفاده کن تا یک تریلر فیلم از تعطیلات آیندهمان به پورتوریکو در سال آینده ایجاد کنی، مطمئن شو که از همه بهترین رستورانها و برجستهترین نشانهها دیدن میکنیم."
او میگوید: "ما عمدتاً آن را در سمت ورودی انجام دادهایم،" و به روشهایی اشاره میکند که گوگل اکنون میتواند یک تصویر یا درون یک ویدیو جستجو کند. "اما شما میتوانید آن را در سمت خروجی نیز تصور کنید."
این نوع آیندهای است که پیچای میگوید مشتاق است آن را آنلاین کند. گوگل قبلاً کمی از آنچه ممکن است به نظر برسد را با NotebookLM نشان داده است، ابزاری که به شما اجازه میدهد مقادیر زیادی متن آپلود کنید و آن را به یک پادکست گویا تبدیل کنید. او تصور میکند که این نوع عملکرد — توانایی گرفتن یک نوع ورودی و تبدیل آن به انواع مختلف خروجی — نحوه تعامل ما با اطلاعات را دگرگون کند.
در یک نمایش از ابزاری به نام Project Astra در کنفرانس توسعهدهندگان گوگل این تابستان، این شرکت یک نسخه از این نتیجه را نشان داد، جایی که دوربینها و میکروفونها در تلفنها و عینکهای هوشمند زمینه اطراف شما — آنلاین و آفلاین، صوتی و تصویری — را درک میکنند و توانایی یادآوری و پاسخ در انواع مختلف را دارند. Astra میتواند، به عنوان مثال، به یک طراحی خام از یک ماشین مسابقه فرمول یک نگاه کند و نه تنها آن را شناسایی کند، بلکه قسمتهای مختلف و کاربردهای آن را نیز توضیح دهد.
اما شما میتوانید تصور کنید که چیزها کمی فراتر بروند (و خواهند رفت). فرض کنید میخواهم ویدیویی ببینم که چگونه چیزی را روی دوچرخهام تعمیر کنم. ویدیو وجود ندارد، اما اطلاعات وجود دارد. جستجوی تولیدی مبتنی بر هوش مصنوعی میتواند به طور نظری آن اطلاعات را در جایی از اینترنت — مثلاً در یک راهنمای کاربر دفن شده در وبسایت یک شرکت — پیدا کند و یک ویدیو ایجاد کند تا دقیقاً به من نشان دهد که چگونه آنچه میخواهم انجام دهم، همانطور که امروز میتواند آن را با کلمات توضیح دهد.
این نوع چیزهایی است که وقتی کل مجموعه دانش بشری — دانشی که قبلاً در انبارهای زبان و فرمت؛ نقشهها و ثبتهای کسبوکار و SKUهای محصول؛ صدا و ویدیو و پایگاههای داده اعداد و کتابهای قدیمی و تصاویر و واقعاً هر چیزی که تا به حال منتشر شده، ردیابی شده، ضبط شده؛ چیزهایی که همین حالا در حال اتفاق افتادن هستند، همه جا — و یک مدل را در تمام آن معرفی کنید، شروع به اتفاق افتادن میکند. مدلی که شاید نتواند دقیقاً درک کند، اما توانایی کنار هم قرار دادن آن اطلاعات، بازآرایی آن، و بیرون ریختن آن به انواع مختلف امیدوارم روشهای مفید را دارد. روشهایی که یک ایندکس صرف نمیتوانست.
این چیزی است که ما در آستانه آن هستیم، و شروع به دیدن آن کردهایم. و همانطور که گوگل این را به یک میلیارد نفر عرضه میکند، بسیاری از آنها برای اولین بار با یک هوش مصنوعی مکالمهای تعامل خواهند داشت، این چه معنایی خواهد داشت؟ چه کار متفاوتی انجام خواهیم داد؟ همه چیز به سرعت در حال تغییر است. صبر کنید، فقط صبر کنید.
Credit: "AI means the end of internet search as we’ve known it” By Mat Honan. published in MIT Technology Review.
Read the full article here: https://www.technologyreview.com/2025/01/06/1108679/ai-generative-search-internet-breakthroughs/