دقت موتورهای کاوش اینترنتی: مطالعه‌ای موردی در ارتباط با علوم زمین

مقدمه
اطلاعات علوم زمین بصورت گسترده‌ای از طریق مؤسسات و شرکتهای دولتی، ملی، منطقه‌ای و بین‌المللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود می‌باشند. برخی از مؤسسات نظیر سازمان زمین‌شناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وب‌های خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره می‌نمایند. بدین ترتیب به منظور آگاهی از اینکه جستجوگر یا گروه جستجو با چه کسی مشارکت دارد یا اینکه مؤسسات دربارهء چه موضوع ویژه‌ای تحقیق می‌کنند، استفاده از یک موتور کاوش ضروری می‌نماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه می‌نماید.

اطلاعات بر مبنای اندازه بانک اطلاعاتی، دسترس‌پذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور کاوش بر مبنای سه نمونه پرسش، ارائه می‌گردد.بخش اول مقاله شرح مختصری از ساختار موتورهای کاوش را بدست می‌دهد. بخش دوم روش‌شناسی بکار رفته در ارزیابی موتورهای کاوش را ارائه می‌نماید. بخش سوم، نتایج حاصل از کاوشهای نمونه برای بررسی می‌نماید و شامل جدولی است که اطلاعات ارزیابی شده را تنظیم می‌کند و راهکارهایی را که می‌تواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای کاوش اینترنتی مفید باشد، مورد بررسی قرار می‌دهد.
۱- ساختار موتور کاوش
موتورهای کاوش وبی همانند یک فهرست، جستجوگران را به یافتن اصطلاحات مورد کاوش هدایت می‌نمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژه‌های موجود در متن یا پایگاه اطلاعاتی کنترل شده را نشان نمی‌دهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای کاوش کار دشواری است.
موتورهای کاوش در سه ردهء اصلی گسترش یافته‌اند. ردهء اول شامل موتورهای کاوش فهرستی یا راهنما۸ می‌باشد که براساس موضوع یا نوع مدرک تنظیم شده‌اند. نمونه‌هایی از آنها عبارتند از:
یاهو! ۹ (یک فهرست مبتنی بر موضوع با یک وسیلهء کمکی کاوش کلیدواژه‌ای)، آرگوس کلیرینگهاوس (مجموعه‌ای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یک موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یک فهرست مبتنی بر موضوع از سایت وب‌های بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی کلیدواژه‌ای یا روبات خزنده (نرم‌افزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامه‌های روباتی یا عنکبوتی را فهرست می‌نمایند. این برنامه‌ها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق داده‌ها، پیوندها و متن صفحات وبی، هدایت می‌شوند. نمونه‌هایی از روبات‌های خزنده عبارتند از: هات بات۱۳، که برنامه‌ای را بکار می‌برد که صفحات وب را کلمه به کلمه فهرست می‌کند. اینفوسیک که اطلاعات را از بین فرامین داده‌ها و پیوندها انتخاب می‌نماید.ردهء سوم موتورهای کاوش عبارتند از: موتورهای کاوش چندشاخه‌ای یا چند روباتی (متاکرولر) ۱۴، که پایگاههای اطلاعاتی موتورهای کاوش متعددی را به طور همزمان جستجو می‌کند و نتایج تلفیقی را ارائه می‌نماید.
نمونه‌هایی از آن عبارتند از: متاکرولر۱۵ که کلیدواژه‌ها را برای جستجوی شش فهرست بطور همزمان بکار می‌برد و آسک جیوز۱۶ که پرسش‌های زبان طبیعی و یک سیستم تخصصی را برای جستجوی پنج موتور کاوش کلیدواژه‌ای بطور همزمان، بکار می‌برد.
در سه ردهء اصلی موتورهای کاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای کاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی کلیدواژه‌ای و نیز درختهای موضوعی قابل مرور می‌باشند (نظیر: یاهو!، گالاکسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای کاوش کلیدواژه‌ای یا روبات خزنده، کانالهای موضوعی سلسله مراتبی به مدرک را در پایگاههای اطلاعاتی‌شان فراهم می‌کنند، مانند: اکسایت، لایکوس۱۹ و اینفوسیک.
به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «کمکی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور کاوش به پاسخ دادن به این سؤالات کمک می‌نمایند:
۱- پایگاه اطلاعاتی چگونه ایجاد می‌شود؟ برخی موتورهای کاوش برای ثبت سایتهای خود به طراحان صفحهء وب متکی هستند، و برخی دیگر برای اطلاعات متمرکز و روزآمد به بخشهای خزندهء وب، وابسته می‌باشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور می‌نماید.
۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یک جستجو، مؤثر خواهد بود. برخی موتورهای کاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور می‌کنند، اما در عمل صفحات بیشتری را فهرست می‌نمایند. موتورهای دیگر هر صفحه را منظور می‌نمایند.
۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یک بار روزآمد می‌شود؟ برنامه‌ریزان، روباتهای خزنده‌ای را طراحی نموده‌اند که بصورت خودکار طبق یک برنامهء منظم کار می‌نماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور کاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.
۴- چه عوامل جستجویی، موتور را حمایت می‌نمایند؟ برخی، امکانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد می‌نمایند، در حالیکه برخی دیگر چنین نمی‌کنند. یکی از مشکلات اصلی در استفاده از موتورهای کاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان می‌باشد، ضمناً برخی موتورهای کاوش به جستجوگران امکان تلفیق مجموعه نتایج را نمی‌دهد.
۵- نتایج جستجو چگونه مرتب شده و نمایش داده می‌شود؟ برخی موتورها نظیر اکسایت که جستجوی مبتنی بر مفهوم را به کار می‌برند، نتایج جستجو را نه تنها برای واژه‌های مشخص بلکه برای مفاهیم مربوطه نیز ارائه می‌نمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یک صفحه ارائه می‌نمایند. برخی موتورهای کاوش تنها فراپیوندهای نتایج مرتب شده را فهرست می‌نمایند. نتایجی که دیگر موتورهای کاوش ارائه می‌نمایند عبارتند از: چکیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرست‌نویسی، معرفی یا اطلاعات مربوط به نویسنده.
اگرچه یک زبان فرمان مشترک برای گسترش ارتباط وجود دارد، لکن هنوز تفاوتهای زیادی به چشم می‌خورد. برای کنترل بیشتر اطلاع‌یابی و نتایج حاصله، جستجوگران باید حداکثر استفاده را از امکانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب که مقایسه‌های جالبی بین موتورهای کاوش اصلی انجام می‌دهند عبارتند از: وب ماتریکس۲۲ تهیه شده توسط‌«مات اسلات»
https://janus.ambrosiasw.com/~fprefect/matrix/
[Note:Link moved; URL changed ۴/۲/۰۲ by ald]
موتورهای کاوش واچ وب سایت۲۳
( https://searchenginewatch.com /)
و موتورهای کاوش :C&#۶۱۶۷۹;Net’s که هرچیز را بر روی شبکه جستجو می‌نمایند (تهیه شده توسط آندره جی. لئونارد)
https://www.cnet.com/Content/Reviews/Compare/Search/index.hml )
[Note: Broken link removed ۸/۵/۹۸ by ald]
این سایت وب‌ها دارای جداولی می‌باشند که در آنها توانائی‌ها، اندازه و رواج موتورهای کاوش اصلی با یکدیگر مقایسه می‌گردد. برای فهرستهای کامل موتورهای کاوش، از سایت وب مؤسسه فناوری حرفه‌ای دانشگاه کارولینای شمالی
( https://www.it.unc.edu/guides/irg-۰۸.html )
[Note: Broken link removed ۳/۴/۰۱ by ald]
و نیز فهرست موتورهای کاوش یاهو بازدید کنید.
https://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).
[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]
۲- روش‌شناسی
فهرستی از موتورهای کاوش مورد بررسی در جدول شمارهء ۱ آورده شده است. در این جدول نام، نشانی اینترنتی، اندازهء پایگاه اطلاعاتی هر موتور و توضیحات کاربر ارائه شده است. ضمناً یک ارزیابی ازدقت موتور جستجو بر مبنای سه نوع جستجوی نمونه نیز، در آن آمده است. سه نمونه پرسش بکار رفته در این تحقیق عبارتند از:
۱) ENSO (نوسان جنوبی EI Ni ?o)
۲) زون گسله مادرید جدید
۳) تولید مس در برزیل
حجم جستجو در این مطالعه، در مقایسه با دیگر مطالعات دقت موتور کاوش (لیتون و اسری و استاوا، ۱۹۹۷) و (تومائیولو و پاکر، ۱۹۹۶)، کم است، لکن با توجه به تأکید بر موضوعات مرتبط با علوم زمین، حائز اهمیت است. برای بررسی نتایج موتور کاوش، پرسش‌های نمونه، بر مبنای پرسش‌های کلیدواژه‌ای، عبارتی و چند مفهومی انتخاب شده است. جستجوهای ساده‌ای که شکل تعریف نشده‌ای از ابزارهای مورد ارزیابی را ارائه می‌دهند. این بدان علت انجام می‌گیرد که راهکارهای جستجوی ابزاری نسبت به راهکارهای جستجوگر، بیشتر مورد استفاده می‌باشد. موتورهای کاوش انتخاب شده برای این مطالعه، از فهرست موتورهای کاوش در سایت‌های مختلف انتخاب شده‌اند از قبیل:
Search Engine Watch
( https://searchenginewatch.com/ )
مقاله ۱۹۹۶ وبستر و پاول «ابزارها و فنون جستجوی وب»،
( https://magi.com/~mmelick/it۹۶jan.htm )
و فهرست ابزارهای جستجوی اینترنتی در کتابخانه دانشگاهی شمال غربی
( https://www.library.nwu.edu/resources/internet/search/ )
و مؤسسه فن‌آوری حرفه‌ای دانشگاه کارولینای شمالی
[ald; Broken link removed ۴/۲/۰۲].
دقت برای سنجش سودمندی موتورهای کاوش بکار رفته است که بر مبنای نسبت تعداد رکوردهای مربوط در ۱۰ تا ۱۵ رکورد اول بازیابی شده، می‌باشد. این نسبت به سه درجه تقسیم می‌گردد: زیاد، متوسط، کم. موتورهای کاوشی که پیوندهای فعال مرتبط با اطلاعات مربوط به پرسش‌های نمونه را ارائه می‌دهند، دارای درجه دقت زیاد می‌باشند، به موتورهای کاوشی که پیوندهای حاشیه‌ای ارائه می‌نمایند (نظیر اطلاعات مس در کشورهای دیگر)، یک درجه دقت متوسط داده شده است. موتورهای کاوشی که تعداد بسیار زیادی پیوندهای کاملاً غیرمرتبط و غیرفعال (نظیر محسوب کردن ENSO بعنوان نام یک شرکت به جای یک پدیدهء هواشناختی یا پیوندهای حاوی اطلاعاتی در مورد مادرید، اسپانیا) را در ۱۰ تا ۱۵ رکورد اول ارائه می‌نمایند، دارای درجه دقت ضعیف می‌باشند. میزان دقت ارائه شده در جداول، بیش از آن که یک معیار واقعی آماری نسبت باشد، تفسیری از نتایج به شمار می‌آید. این مطالعه یک نوع ارزیابی آماری از دقت نتایج موتورهای کاوش نیست بلکه عبارت از یک کاوش تفسیری ابزارها و سودمندی آنها در علوم زمین می‌باشد.در صورتی که اطلاعات حاصل از نتایج یکدست بوده و داده‌های حقیقی را بدست دهد و بتواند در یک فعالیت مرجع بکار رود، آنگاه نتایج حاصله مناسب و مرتبط خواهد بود.کیفیت پیوندهای ارائه شده، به منظور پی بردن به دقت، توانایی، پوشش، روزآمد و منحصر به فرد بودن، بررسی شده است. (رتینگ، ۱۹۹۶؛ تیت و الکساندر، ۱۹۹۶). بعنوان مثال، به صفحاتی که اطلاعات قابل تأیید را که مستقیماً با پرسش مربوطه مرتبط می‌باشد را فراهم می‌نمایند، امتیاز بالا داده می‌شود. به صفحاتی که اطلاعات حاشیه‌ای، غیرقابل تأیید و تکراری را فراهم می‌نمایند و مستلزم آنند که کاربر جستجوی اضافی انجام دهد، امتیاز متوسط داده می‌شود. به موتورهای کاوشی که پیوندهای کاملاً نامرتبط یا غیرفعال ارائه می‌نمایند، امتیاز ضعیف داده می‌شود. در حالی که مطالعات دیگر، حجم گسترده‌ای را جهت منظور نمودن گرایشات جستجوگر به هنگام تعیین ارتباط پیوندهای ارائه شده، به خود اختصاص می‌دهد، پژوهش حاضر، مطالعه‌ای تفسیری در یک زمینهء موضوعی خاص است. بنابراین در آن تعدیل گرایشات بالقوه جستجوگر در ارزیابی نتایج، موردنظر قرار نمی‌گیرد.موتورهای کاوش از نظر اندازه نیز در سه رده جای می‌گیرند: موتورهای کاوش بزرگ، دارای بیش از ۲۵ میلیون ارل یا صفحات وب، موتورهای کاوش متوسط دارای بین ۱ میلیون و ۲۵ میلیون ارل یا صفحات وب و موتورهای کاوش کوچک دارای کمتر از یک میلیون ارل یا صفحات وب. برخی اندازه‌ها تقریبی می‌باشند
۳- نتایج
تعیین عناوین ویژه: نتایج فهرست یا راهنما
به هنگام جستجوی عناوین ویژه، نظیر هواشناسی یا چینه‌شناسی، بهترین نقطه برای شروع عبارت است از: موتورهای کاوش فهرستی یا راهنما که پیوندهای موضوعی را ارائه می‌دهند نظیر: یاهو، گالاکسی یا اینترنت اسلوث. هر یک از این ابزارها، درختهای موضوعی چند ردیفه را ارائه می‌کنند. بعنوان مثال روی صفحهء اصلی گالاکسی، جستجوگر می‌تواند بیش از ۱۱ رده اصلی و ۱۴۸ زیررده را انتخاب نماید. پیوندهای اطلاعات علوم زمین و محیط زیست می‌تواند در جاهای متعددی یافت شود: بعنوان مثال زیر رده «محیط زیست» تحت رده‌های اصلی «جامعه» و «قانون»؛ «جغرافیا» زیر ردهء «علوم اجتماعی»؛ و «غارشناسی» زیر ردهء «سرگرمی و تفریحات» قرار می‌گیرند. بیشترین پیوندها برای علوم زمین زیر «علوم زمین» در ردهء «علوم» وجود دارد. صفحهء علوم زمین دارای ۵ رده برای علوم زمین است. شامل: «ژئوشیمی»، «زمین‌شناسی»، «زمین‌شناسی دریایی»، «ژئوفیزیک» و «هواشناسی و اقلیم‌شناسی». بدنبال پیوند برای «هواشناسی و اقلیم‌شناسی»، جستجوگر پیوندهایی را که در رده‌های زیر گرد آمده‌اند، بدست می‌آورد: مؤسسات آموزشی، مقالات (متن کامل)، نقشه‌کشی، مجموعه‌ها، راهنماها، سازمان‌های دولتی و مؤسسات. در هر بار جستجو، جستجوگر می‌تواند جستجوهای کلیدواژه‌ای بانک اطلاعاتی یا پیوند با رده‌های مرتبط را، در کل سطوح مختلف موتور گالاکسی انجام دهد.بررسی موتورهای چند راهنما یا فهرستی می‌تواند بیانگر ناکامی برخی از موتورها در استفاده از یک واژگان کنترل شده باشد. Librarians Index و WWW Virtual Catalog هر دو، اطلاعات را از طریق رده‌های موضوعی کتابخانهء کنگره (و نه از طریق شمارهء رده LC)، رده‌بندی می‌نمایند. برنامه‌ریزان یاهو به طرح رده‌بندی موضوعی بلاواسطه خود می‌بالند. لوک اسمارت یک فهرست موضوعی ۱۶۰۰۰ تایی را ارائه می‌نماید. موتورهای کاوش فهرستی، قابلیت استفاده خود را به تحقیقات بزرگ محدود می‌نمایند (لکن بدون استفاده از اصطلاحنامه اسامی و موضوعی). این نکته بویژه برای آن دسته از رده‌های علمی که پیدا کردن آنها با مرور کردن یا جستجوی کلیدواژه‌ای مشکل است، صادق است. علوم زمین و سایر رده‌های علمی غالباً زیر عناوینی چون «آموزش و پرورش»، «مرجع» یا «یادگیری»، مخفی می‌شوند. اگر یک عنوان مفید، پس از مرور یک یا دو سطح پوشش داده نشود، پرسش از بانک اطلاعاتی توسط کلیدواژه‌ها انجام می‌شود. جامع‌ترین درختهای موضوعی مرتبط با علوم زمین در دو موتور کاوش یافت می‌شوند: یاهو و WWW Virtual Library. به کمک این ابزارهای جستجو روی موتورهای کاوش نوع فهرستی می‌توان در مقایسه با مرور ساده فهرستهای موضوعی، به دقت بیشتری دست یافت. بعلاوه این ابزارهای جستجو قابلیت انعطاف بیشتری در رابطه با جستجوی متن پایگاه اطلاعاتی، که در غیاب واژگان‌های کنترل شده یا فهرست‌های موضوعی برای پایگاه‌های اطلاعاتی، بسیار مفید می‌باشند، فراهم می‌نمایند. موتور کاوش جی اوتو دارای بیشترین دقت در ابزار جستجو می‌باشد. (ابزارهای آرگوس کلیرینگهاوس و اینفوماین نیز نتایج دقیقی در ارتباط با پرسش‌های نمونه ارائه کرده‌اند. به هر حال در هنگام استفاده از این ابزارها، لازم است جستجوگر نسبت به این نکته که پایگاه‌های اطلاعاتی آنها کوچک بوده و اینکه دقت بستگی به وجود یا عدم وجود موضوع مورد پرسش در پایگاه اطلاعاتی دارد، آگاه باشد. بعنوان مثال پرسش «ENSO»، در مقایسه با پرسش‌های «زون گسله مادرید» و «تولید مس در برزیل»، نتایج بسیار دقیق‌تری در موتورهای آرگوس و اینفوماین ارائه می‌کند).
تعیین اطلاعات ویژه: نتایج کلیدواژه‌ای یا روبات نرم‌افزاری (خزنده)
نیازهای اطلاعاتی دقیق یا بسیار ویژه، با موتورهای کاوش کلیدواژه‌ای یا چندشاخه‌ای، بهتر تأمین می‌شود. با این ابزارها جستجوگران می‌توانند با استفاده از برخی واژه‌های جستجوی منحصر به فرد در حد امکان، دقت را افزایش دهند. موتورهای جستجوی کلیدواژه‌ای یا روبات‌های نرم‌افزاری (خزنده) که دارای بیشترین میزان دقت و مرتبط‌ترین پیوندهای فعال می‌باشند عبارتند از: اکسایت و اینفوسیک.
جستجوی تعریف نشده اینفوسیک برای «تولید مس در برزیل»، دارای دقت کمی است، در حالی که جستجو در مورد «زون گسله مادرید جدید» دقت متوسطی دارد. (دقت به کمک جستجوی موردی دقیق بالا می‌رود، بعنوان مثال «New Madrid fault zone» در مقایسه با «new Madrid fault zone» نتایج دقیق‌تری بدست می‌دهد). دقیق‌ترین جستجوی اینفوسیک جستجوی کلیدواژه‌ای روی «ENSO» می‌باشد. استفاده از گزینه‌های اصلاحی اینفوسیک، موجب تکمیل نتایج در تمامی جستجوها می‌گردد. بعنوان مثال، فرمان «pipe»، که رکوردهای مرتبط را در مجموعهء بزرگتری از رکوردها جستجو می‌کند، یا «مس &#۶۱۶۹۰;برزیل» که به مدارک مرتبط‌تری در مقایسه با جستجوی استاندارد هدایت می‌کند. در نتیجه پیوندهای «موضوعی مربوط» اینفوسیک، برخی پیوندهای اضافی مرتبط را نشان نمی‌دهند.اکسایت با استفاده از جستجوهای عبارتی و چند مفهومی در مقایسه با پرسش کلیدواژه‌ای، بهتر عمل می‌کند. پرسش ساده در ارتباط با «تولید مس در برزیل»، در صفحهء انجمن توسعهء مس، تحت عنوان «مس: بازار و آمار داده‌ها»، اطلاعیه‌های رسمی و گزارشات سالانه از شرکتهای مرتبط با معادن مس در برزیل، را پیدا نموده است. اکسایت چندین پیوند تکراری را در تمامی پرسش‌های نمونه ارائه نموده است، بعنوان مثال در جستجوی «ENSO» صفحهء NOAA-CIRES ENSO را در هر دو آدرس
https://www.cdc.noaa.gov/enso/index.html
https://www.cdc.noaa.gov/eno/
ارائه می‌نماید. گزینهء «مانند این»۲۵ در اکسایت، هیچ نوع پیوندهای اضافی مرتبط را در هر یک از سؤالات نمونه بازیابی نمی‌کند.
نتایج اکسایت و اینفوسیک برای پرسش «تولید مس در برزیل»، مشابه می‌باشند و عمدتاً اطلاعیه‌های رسمی، گزارشات سالانه و گزارشات فنی شرکتهای معدنی و تولیدی را ارائه می‌نمایند. خطای اصلی در ارتباط با این پرسش، آن است که مس بعنوان یک مکمل کانی غذایی در نظر گرفته می‌شود. (با کمال تعجب «زغال سنگ برزیل»، منبع خوبی برای مس می‌باشد). خطای اصلی در ارتباط با پرسش «ENSO»، شرکتهای تحت عنوان ENSO می‌باشد، در حالیکه معمولترین خطا در ارتباط با پرسش «زون گسله مادرید جدید» عبارت از پیوند با سایتهایی در مورد زونهای لرزه‌ای غیرمرتبط و گسله‌ها می‌باشد.
نورترن لایت، یکی دیگر از موتورهای کاوش کلیدواژه‌ای مفید است. این موتور نتایج را بصورت پوشه‌هایی بر مبنای فراوانی و موضوع مرتب می‌نماید. برخی پوشه‌ها که با جستجوی نمونه روی تولید مس برزیل ایجاد شده‌اند عبارتند از: «سایت‌های تجاری»، «صنعت معدن‌کاری»، «صنعت فلزات»، «زغال سنگ» و «سم‌شناسی». پوشه‌ها برای جستجوی «ENSO» عبارتند از: «صفحات شخصی»، «آب و هواشناسی» و «www.coaps.fsu.edu». نورترن لایت همچنین چند پایگاه اطلاعاتی «مجموعهء ویژه»۲۶ پیوسته را که مقالات مجلات را پیدا می‌نماید، جستجو می‌کند. این مقالات را می‌توان از نورترن لایت، با پرداخت هزینه بین ۲ تا ۶ دلار بسته به حجم و منبع مقاله خریداری نمود. این پیوند اینترنت و پایگاه‌های اطلاعاتی متون، عاملی در گرایش به بازدید وب می‌باشد.موتور کاوش پلانت سرچ۲۷، که میزان دقت متوسط را بدست آورده است، دارای یکی از بهترین نمایش‌ها برای نتایج جستجو می‌باشد. نتایج پلانت سرچ شامل یک نمودار ستونی جهت تصویر نمودن ارتباط برای هر واژه مورد جستجو در پرسش می‌باشد. نمودارهای ستونی نه تنها نشان‌دهنده ارتباط هر واژه برای رکورد پیدا شده می‌باشند، بلکه نتایج کلی برای جستجوی کامل را نیز نشان می‌دهند. هر رکورد همچنین دارای گزینهء «پیدا کنید مشابه»، تاریخ رکورد و تعداد کلمات در رکورد می‌باشد. پلانت سرچ همچنین به جستجوگر اجازه می‌دهد تا راهنماهای خرید را برای نتایج جستجو و نشانه‌ها ایجاد نماید. پلانت سرچ در نتایج خود، تکراری‌هایی را به همراه دارد، بعنوان مثال همراه بودن سایت‌های فرعی برای فهرست الفبایی گسل کالیفرنیای جنوبی در نتایج «زون گسله مادرید جدید» و نیز سه پیوند به صفحهء اصلی روزنامهء ENSO در نتایج «ENSO».لیکوس میانگین اعمال فوق را با جستجوهای عبارتی و چند مفهومی انجام می‌دهد، لکن نتایج پرسش کلیدواژه‌ای ضعیف است. وب کرولر و ماژلان (موتور کاوس نوع فهرستی/راهنما)، دارای نتایج یکسان برای هر سه پرسش می‌باشند. بعلاوه نتایج وب کرولر و ماژلان صرفنظر از نوع آنها، تقریباً بی‌دقت‌ترین نتایج در بین موتورهای مورد استفاده می‌باشد. بعنوان مثال، اولین سایت فهرست شده در پرسش «زون گسله مادرید جدید» عبارت است از یک نقشه مادرید، اسپانیا، ضمن آن که پنجمین پیوند ارائه شده عبارت است از زون ورزشی Soccer: ESPN. هات بات دارای دقت متوسط بوده و فاقد جستجوی «تمام لغات» می‌باشد، لکن با استفاده از شکل «عبارت درست» همراه با پرسش‌های عبارتی و چندمفهومی، دقت تا حدودی افزایش می‌یابد. وات-یو-سیک۲۸ در ارتباط با جستجوهای عبارتی و چند مفهومی دارای دقت کمی است، اما برای جستجوی کلیدواژه‌ای روی «ENSO»، نتایج نسبتاً دقیقتری دارد. نتایج آلتاویستا در ارتباط با جستجوهای تعریف نشده، متوسط است اما با استفاده از گزینهء «پالایش»۲۹، دقت تا حدودی افزایش می‌یابد. نتایج آلتاویستا در ارتباط با تمامی پرسش‌ها دارای پیوندهای تکراری می‌باشد.پوشش گسترده و وسیع: با استفاده از ابرموتورهای کاوش
موتورهای کاوش چند شاخه‌ای، با افزایش اندازهء وب، رایج‌تر و مناسب‌تر می‌گردند. در عین حال استفاده از این موتورها نیز تعدادی پیوندهای ضعیف به همراه دارد. به ویژه، موتورهای چندشاخه‌ای، متکی بوده و کنترلی روی جامعیت و روزآمدی پایگاههای اطلاعاتی که جستجو می‌نمایند، ندارند. همچنین این موتورها، پرسش‌ها را به چندین پایگاه اطلاعاتی که هر یک از نظر ساختار و جستجو متفاوت می‌باشند، می‌فرستند. این ابزارها عموماً دارای یک تکذیب‌نامه پنهان در جایی مانند بخش «درباره» می‌باشند که بیانگر آن است که نتایج حاصل از راهکارهای جستجوی پیچیده بولی-تقریبی و سایر عملگرها نمی‌تواند تضمین کننده باشد. در عین حال برخی از نتایج موتورهای کاوش چند رشته‌ای، منابع دقیقی برای جستجوی وب به شمار می‌آیند.
بیشتر موتورهای کاوش چندشاخه‌ای همانگونه که در جدول ۱ نشان داده شده دارای نتایج متوسط‌اند. هیچ یک از موتورهای کاوش چندشاخه‌ای در ارتباط با پرسش‌های نمونه بعنوان بهترین ظاهر نشده‌اند. بیشتر موتورها با ستجوهای کلیدواژه‌ای بهتر عمل می‌کنند، در حالیکه برخی دیگر مفیدترین نتایج را با پرسش‌های عبارتی یا چند مفهومی ارائه می‌نمایند. بعنوان مثال، ماما۳۰، پروفوشن۳۱ و متاکرولر با پرسش عبارتی «زون گسله مادرید جدید» و پرسش چندمفهومی «تولید مس در برزیل» بهتر عمل می‌کنند. اینفرنس فایند۳۲ و آسک جیوز دارای نتایج دقیق‌تری برای جستجوی کلیدواژه‌ای «ENSO» می‌باشند.رابط برخی موتورهای جستجوی چندشاخه‌ای به کاربر اجازه تصفیه یا جستجوی مستقیم در سطح بالا را می‌دهد. بعنوان مثال متاکرولر و ساوی سرچ۳۳ به کاربر اجازه می‌دهند تا برای واژه‌های مورد جستجو از «همه» یا «هریک» و نیز «بصورت یک عبارت» استفاده نماید. پروفوشن یک شکل تعریف نشده، یک شکل بولی یا یک شکل عبارتی را ارائه می‌نماید. در حالیکه ماما به کاربر اجازه می‌دهد تا برای واژه‌ها «بصورت یک عبارت» را جستجو نماید یا جستجو برای واژه‌ها را تنها به «عناوین مدرک»، محدود نماید.تعدادی از موتورها نظیر متافایند و اینفرس فایند، نتایج جستجوها را بوسیله کلیدواژه دسته‌بندی می‌کنند. برخی موتورها نظیر آسک جیوز و ساوی سرچ، نتایج را توسط ابزاری که پیوندها را ارائه می‌کند، گروه‌بندی می‌نمایند. بیشتر آنها، نتایج را با مرتب کردن ارتباط بر مبنای نسبت جا و زمانی که واژه‌های مورد جستجو پیدا می‌شوند، نمایش می‌دهند.اینترنت اسلوث که یک موتور کاوش نوع فهرستی یا راهنما است، نیز می‌تواند بعنوان یک موتور کاوش چند رشته‌ای بکار رود. صفحهء اصلی اینترنت اسلوث بیش از ۲۱ رده موضوعی را که می‌تواند به آسانی با نمایش زیر رده‌ها گسترش یابد، ارائه می‌نمایند. ردهء علوم دارای ۹ زیر رده است که یکی از آنها «علوم زمین» می‌باشد. زیر رده «علوم زمین» موتورهای کاوش را برای بیش از ۱۱ نمونه از منابع مختلف علوم زمین نظیر ولکانوورلد و فهرست صفحات فنی SPE ارائه می‌کند. در حالیکه «علوم زمین» در اینترنت اسلوث یک فهرست جامع را بدست نمی‌دهد، پیوندها دسترسی به منابع تمام متن با کیفیت بالا را فراهم می‌نمایند. این دسترسی به موتورهای کاوش موضوعی، منحصر به فرد است. علاوه بر موتورهای جستجوی موضوعی، صفحهء اصلی اینترنت اسلوث نیز فرصتی را برای جستجوی کامل وب همزمان از طریق ۶ موتور کاوش اصلی کاوش (آلتاویستا، اکسایت، اینفوسیک، لیکوس، وب کرولر و یاهو) فراهم می‌نماید. جستجوگران می‌توانند همچنین از موتورهای چند مروره، اخبار، بازرگانی و مالی، نرم‌افزار و یوزنت بازدید نمایند.آسک جیوز که پرسش‌های زبان طبیعی را بکار می‌برد، با پرسش کلیدواژه‌ای در مورد «ENSO» دقت بالای متوسطی را می‌دهد، لکن با پرسشهای عبارتی و چند مفهومی دقت زیر متوسط دارد. پرسش‌های جستجو از طریق یک سیستم تخصصی که نه تنها راهکارهای متناوب را برای جستجو اولیه پیشنهاد می‌کند، بلکه پرسش را به موتورهای اکسایت، هات بات، وب کرولر، آلتاویستا و اینفوسیک می‌فرستد، تقویت می‌گردد. پرسش نمونه در مورد «ENSO» به شش پرسش اضافی در شکل ۱، منتج شده است. راهکارهای جستجوی متناوب ارائه شده، کاملاً مرتبط با پرسش اولیه می‌باشد و برای کاربر فرصتی را جهت تمرکز جستجو روی یک مفهوم ویژه از واژه مورد جستجو فراهم می‌نماید. آسک جیوز نیز ده منبع را از هر ۵ موتور کاوشی که مورد پرسش قرار داده، ارائه می‌نماید. نتایج آسک جیوز از موتورهای مورد پرسش، با نتایج حاصل از موتورهای کاوش انفرادی هماهنگ می‌باشد (جدول ۱ را ملاحظه نمائید).
- سیستم تخصصی آسک جیوز که پرسش‌های متناوب را پیشنهاد می‌نماید
- جدیدترین پوشش خبری روی El Nino چیست؟
- یک El Nino چیست؟
- اطلاعات در مورد El Nino ۹۸-۱۹۹۷ را کجا می‌توان پیدا کرد؟
- جدیدترین پوشش خبری در مورد طوفانهای کالیفرنیا چیست؟
- اطلاعات در مورد عناوین هواشناسی El Nino را کجا می‌توان پیدا نمود؟
های‌وی ۶۱ در ارتباط با جستجوهای عبارتی و چندمفهومی دارای دقت بالای متوسط است. های‌وی ۶۱ پرسش‌ها را به ۶ موتور جستجو شامل: یاهو، آلتاویستا، لیکوس، وب کرولر، اینفوسیک و اکسایت می‌فرستد. تعداد نتایج نمایش داده شده توسط جستجوگر تعیین می‌شود. وی تعداد موتورهای کاوشی را که می‌تواند نتایج را پیدا کرده و نیز تعداد نتایج را به نمایش بگذارد، انتخاب می‌نماید. نتایج در مورد پرسش نمونه «تولید مس در برزیل» عبارت است از چند گزارش دولتی منحصر به فرد، همچنین بیشترین سایت وب‌ها را از طریق حوزهء برزیل پیدا نموده است.هنگام استفاده از موتورهای کلیدواژه‌ای و چندشاخه‌ای، توجه به اینکه چه بخش‌هایی از صفحات موتور در حال جستجو بوده و بسط یک عبارت جستجوی دقیق حائز اهمیت است. حجم اطلاعات موجود روی وب، مستلزم استفاده از گزینه‌های «پیشرفته» یا «پالایش» برای نتایج جستجوی دقیق‌تر می‌باشد. بعلاوه جستجوگران باید توصیه ارائه شده از طریق اینفوسیک را در نظر داشته باشند: «پرسش‌های بیشتر بهتر جواب می‌دهد». یک سری واژه‌های مشخص و واحد را برای بدست آوردن نتایج دقیق‌تر بکار ببرید. این توصیه برای یافتن اطلاعات علوم زمین و نیز هر جستجوی موضوعی دیگر بر روی وب، معتبر و با ارزش می‌باشد.
نتیجه‌گیری
نتایج حاصل از این مطالعه، منطبق با دیگر مطالعات دقت می‌باشد که در آن هیچ یک از موتورهای کاوش بعنوان دقیق‌ترین موتور برای یافتن اطلاعات روی وب جهانی ظاهر نشده‌اند. حتی در ارتباط با پرسش‌های علوم زمین نیز، هیچ از یک ابزارها ممتاز و برجسته نبوده‌اند. در مطالعه ۱۹۹۶، تومایولووپاکر، آلتاویستا را بعنوان ابزاری که بیشترین تعداد پیوندهای ارتباطی را بر مبنای اولین ده پیوند بازیابی شده ارائه نموده است، تعیین نموده‌اند. یک ارزیابی در ارتباط با میزان دقت پرسش‌های مرتبط با علوم زمین بدین صورت است: ۱) اینفوسیک نتایج دقیق‌تری بدست می‌دهد. ۲) لیکوس و آلتاویستا به نحو قابل ملاحظه‌ای، دقت کمتری دارند. لیتون و اسریواستاوا که پیشرفته‌ترین روش‌شناسی را در مطالعه خود مورد استفاده قرار دادند، نیز به این نتیجه رسیدند که به طور قاطع دقیق‌ترین موتور کاوش وجود ندارد.به هر حال «یک الگوی مشخص ارائه می‌گردد. آلتاویستا، اکسایت و اینفوسیک همواره خدماتی با بیشترین امتیاز متوسط ارزیابی شده می‌باشند» (۱۹۹۷-
https://www.winona.msus.edu/library/webind۲/wi۲pt۳.htm#RESULTS
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
بر مبنای دیگر مطالعات منتشره و نتایج حاصله در مطالعه مرتبط با علوم زمین، به جستجوگرانی که سعی در یافتن «هر» نوع اطلاعات روی وب جهانی دارند، توصیه می‌شود از مجموعه‌ای از ابزارها متناسب با نوع پرسش ارائه شده و نوع اطلاعات موردنیاز استفاده نمایند.
همانگونه که لیتون و اسریواستاوا اظهار داشته‌اند، «محاسبه دقت حقیقی (نسبت مدارک مرتبط ارائه شده به تعداد کل مدارک ارائه شده) بسیار دشوار است، چرا که مستلزم آزمودن تمامی پیوندهای ارائه شده توسط یک سرویس که می‌تواند تعداد آن به هزاران یا میلیونها برسد، می‌باشد».( ۱۹۹۷،https://www.winona.msus.edu/library/webind۲/wi۲pt۲.htm#EVALCRIT ,p۳ of ۸).
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
ضمن قبول نقاط ضعف این مطالعه، امید است که نتایج حاصله بتواند بعنوان راهنمایی برای استفاده از موتورهای کاوش اینترنت جهت یافتن اطلاعات علوم زمین روی وب جهانی، مفید باشد.
توضیحات نهایی
۱) تمامی پرسشهای مربوط به علوم زمین، در این مطالعه عبارت از پرسشهای کلیدواژه‌ای یا عبارتی می‌باشند. پرسشها عبارتند از: بهمن‌ها، فعالیت آبهای سرد، زمین‌لرزه، گرم شدن جهانی، صاعقه، حوادث طبیعی، کاهش ازن، پلاستیک بازیافتی، صفحات تکتونیکی، گردبادها، آتشفشانها و طراحی آب پخشان.
۲) ارزیابی کلی در مطالعه تومایلو و پارکر بدین شرح است: آلتاویستا ۳/۹، اینفوسیک ۳/۸ و لیکوس ۱/۸. از تحلیل پرسشهای مرتبط با علوم زمین، این نتایج حاصل شده: اینفوسیک ۵/۹، لیکوس ۷/۸ و آلتاویستا ۳/۸.

تبلیغات