چه اطلاعاتی درمورد سازوکار موتور جستجوی گوگل آشکار شده است؟_خبرخوان

چه اطلاعاتی درباره سازوکار موتور جستجوی گوگل فاش شده است؟


به گزارش خبرخوان

چند روز پیش اسنادی ۲۵۰۰ صفحه‌ای از سازوکارهای موتور جستجوی گوگل افشا شد که این شرکت نیز صحت آن را قبول کرد. اگرچه این اسناد الگوریتم این موتور جستجو را آشکار نمی‌کند، اما دارای اطلاعات زیاد ارزشمندی است که فرایندهای درونی گوگل را مشخص می کند، فرایندهایی که طبق معمولً افشا نمی‌شوند. اما اکنون می‌خواهیم نگاهی مختصر به برخی از اطلاعات مهم این اسناد داشته باشیم.

به گمان زیادً برجسته‌ترین مسئله درمورد این اسناد وجود اطلاعاتی است که مشخص می کند نمایندگان گوگل در قبل، هنگامی که درمورد برسی و رتبه‌بندی محتواها توسط این موتور جستجو سخن بگویید می‌کردند، مخاطبان را فریب داده بودند.

این که گوگل چطور محتواها را رتبه‌بندی می‌کند درون یک جعبه سیاه اتفاق می‌افتد. تعداد بسیاری از وب‌سایت‌ها برای بقای خود به ترافیک حاصل از موتور جستجو متکی می باشند، و زیاد از آن‌ها تلاش – و هزینه – بسیاری می‌کنند تا از رقیب ها پیشی بگیرند و در نتایج رتبه خود را ارتقا دهند. رتبه بهتر به‌معنی بازدیدکننده زیاد تر، و در نتیجه، درآمد زیاد تر است. ازاین‌رو، گردانندگان سایت‌ها به تک‌تک داده‌هایی که از جانب گوگل یا کارمندان آن انتشار می‌شود، دقت می‌کنند.

گوگل کاربران را فریب داده است؟

برای مثال، سخنگویان گوگل در طول سال‌های تازه به‌دفعات نقش کلیک‌های کاربر در رتبه‌بندی سایت‌ها را رد کرده‌اند، اما اطلاعات افشاشده انواعی از کلیک‌های کاربر را مشخص می کند و می‌گوید این کلیک‌ها در رتبه‌بندی صفحات در موتورهای جستجو اعمال می‌شود.

«رند فیشکین»، متخصص بهینه‌سازی موتور جستجو (SEO) که در کنار «مایک کینگ» به دیده‌شدن این اسناد افشاشده پشتیبانی کردند، می‌گوید: «برای من، مسئله مهم‌تر و کلی‌تر این است که شواهد محکمی علیه تعداد بسیاری از اظهارات عمومی گوگل درمورد این که آن‌ها چه داده‌هایی را گردآوری می‌کنند و موتور جستجویشان چطور کار می‌کند، وجود دارد.»

اطلاعات آشکار‌شده حاوی مخازنی مملو از داده‌های گوناگون درمورد گردآوری محتوا توسط گوگل است و برخی از این موارد امکان پذیر بر نحوه رتبه‌بندی صفحات در موتور جستجو تأثیر بگذارد. در ابتدا گوگل درمورد صحت این اسناد واکنشی نشان نداد، اما بعداً آن را قبول کرد.

در بیانیه این شرکت آمده است: «ما نسبت به تشکیل فرضیات نادرست درمورد نتایج جستجوها بر پایه اطلاعات قدیمی یا ناقص هشدار می‌دهیم. ما اطلاعات بسیاری درمورد نحوه کارکرد موتور جستجوی خود و عواملی که سیستم‌های ما مورد بازدید قرار خواهند داد، به اشتراک گذاشته‌ایم. درعین‌حال از یکپارچگی نتایج جستجوها در برابر دستکاری محافظت می‌کنیم.»

هیچ گواهی در این اسناد وجود ندارد که مقدار اثرگذاری خصوصیات یا صفات (Attributes) گوناگون را نشان دهد. این امکان وجود دارد که برخی از صفات حاضر در بین این اطلاعات – نظیر شناسه «سایت‌های شخصی کوچک» یا کم شدن رتبه به‌علت نقد محصول – در بخشی از سازوکار موتور جستجو پیاده‌سازی شده باشد، اما به‌نظر می‌رسد که بعداً از رده خارج شده است. این چنین نمی‌توان با قطعیت او گفت که از آن‌ها برای رتبه‌بندی سایت‌ها منفعت گیری شده است.

کینگ می‌گوید صرف‌نظر از توصیفاتی که برای مؤلفه‌های ذکرشده وجود دارد، لزوماً نمی‌دانیم که چطور از آن‌ها منفعت گیری می‌شود. از طرفی، اگرچه اطلاعات درمورد آن‌ها پراکنده است، اما می‌توانیم داده‌های بسیاری را در این عرصه مشاهده کنیم.

در سایت خبری خبرخوان آخرین اخبارحوادث,سیاسی,فرهنگ وهنر,اقتصاد و تکنولوژی,دفاعی,ورزشی,ایران,جهان را بخوانید.

این که بزرگ‌ترین پلتفرم جستجوی جهان رتبه‌بندی نتایج جستجوی خود را مبتنی بر چگونگی تعامل کاربر با محتوا تنظیم نکند، در ظاهر غیرمنطقی به‌نظر می‌رسد. ولی تکذیب‌های مکرر، منفعت گیری از کلمات دقیق در جواب‌های گوگل، و مطالب گوناگونی که این ادعاها را تکرار می‌کنند، علتشده تا این مبحث در بین متخصصان سئو به یک نوشته او گفت و گو‌برانگیز تبدیل شود.

1717261124 562 چه اطلاعاتی درمورد سازوکار موتور جستجوی گوگل آشکار شده است؟ خبرخوان

موتور جستجوی گوگل از کروم اطلاعات می‌گیرد

مسئله مهم فرد دیگر که فیشکین و کینگ به آن اشاره کرده‌اند، به چگونگی منفعت گیری از داده‌های کروم در رتبه‌بندی جستجو مربوط می‌شود. نمایندگان گوگل قبلاً حرف های بودند که این شرکت از داده‌های کروم برای رتبه‌بندی منفعت گیری نمی‌کند، اما اسناد افشاشده امکان پذیر خلاف این قضیه را نشان دهد. برای مثال، در یک قسمت به chrome_trans_clicks اشاره شده که انگارً اشکار می‌کند کدام لینک‌ها از یک دامنه باید در قالب زیرمجموعه آن در نتایج جستجو نمایش داده شوند. فیشکین معتقد است که این یعنی گوگل از تعداد کلیک روی صفحات در کروم منفعت گیری می‌کند تا محبوب‌ترین یا با اهمیت ترین صفحات را به‌دست آورد و آن‌ها را در نتایج جستجو نشان دهد.

در فایل‌های آشکار‌شده بیشتر از ۱۴ هزار صفت وجود دارد، و محققان هفته‌ها زمان صرف بازدید این اطلاعات خواهند کرد. در این اسناد به «وررونده‌ها» (Twiddlers) نیز اشاره شده که انگارً سازوکارهایی برای تعیین رتبه در خارج از به‌روزرسانی‌های بزرگ سیستمی است. این دستکاری‌ها تبدیل تحکیم یا کم شدن رتبه یک محتوا بر پایه یک معیار خاص می‌شود. عناصر صفحات وب، نظیر این که نویسنده کیست، هم به‌گفتن مقدار «اعتبار» سایت‌ها ذکر می‌شود. فیشکین می‌گوید تعداد بسیاری موارد دیگر همانند محتواهای خلق‌شده با هوش مصنوعی نیز وجود دارد که در این اسناد به آن‌ها اشاره نشده است.

همه این‌ها برای افرادی که درون صنعت SEO کار نمی‌کنند، به چه معناست؟ در وهله اول، باید انتظار داشت که همه گردانندگان وب‌سایت‌ها این اطلاعات آشکار‌شده را بخوانند و تلاش کنند از آن‌ها سر در بیاورند. ترفندهای بسیاری به کار گرفته خواهد شد تا اشکار شود که کدام مواد جواب می‌دهد. ناشران، شرکت‌های تجاری و کسب‌وکارها هم به گمان زیادً آزمایش‌های گوناگونی انجام خواهند داد تا داده‌های اراعه‌شده در این اسناد را آزمایش کنند. به این علت می‌توان گمان زد که در آینده ظاهر و محتوای وب‌سایت‌ها تحول کند.

فیشکین می‌گوید: «خبرنگاران و افرادی که اطلاعات مربوط به سئو و گوگل سرچ را انتشار می‌کنند، باید از نقل‌قول چشم‌بسته بیانیه‌های عمومی گوگل دست بردارند، و نگاه سخت‌گیرانه‌تر و دقیق‌تری به حرف های‌های نمایندگان این غول موتور جستجو داشته باشند. هنگامی که رسانه‌ها ادعاهای گوگل را به‌نحوی تکرار می‌کنند که گویی حقیقت دارند، آن‌ها درحال پشتیبانی به روایتی از داستان گوگل می باشند که تنها برای این شرکت سودمند است، نه برای متخصصان، کاربران یا عموم مردم.»

دسته بندی مطالب
اخبار کسب وکار

اخبار تکنولوژی

اخبار اقتصادی

اخبار فرهنگ وهنر

اخبار تکنولوژی

اخبار سلامتی