noindex (لا فهرسة) هي قيمة في الوسوم الوصفية [الإنجليزية] لبوتات الإتش تي إم إل تمنع بوتات البحث من فهرسة الصفحة، وبالتالي عدم ظهورها في نتائج البحث.[1][2] تتضمن الأسباب التي قد تجعل المرء يرغب في استخدام هذه الوسم الوصفي توجيه البوتات بعدم فهرسة قاعدة بيانات كبيرة جدًا، أو صفحات الويب المؤقتة جدًا، أو صفحات الويب قيد التطوير، أو صفحات الويب التي يرغب الشخص في الاحتفاظ بها بشكل أكثر خصوصية، أو الطابعة و إصدارات الصفحات الملائمة للجوال. نظرًا لأن عبء احترام وسم noindex الخاصة بموقع الويب يقع على عاتق مؤلف بوت البحث، فقد لل يُلتزم بهذه العلامات في بعض الأحيان. كما يختلف أحيانًا تفسير وسم noindex قليلًا من شركة محرك بحث إلى أخرى.
<html> <head> <meta name="robots" content="noindex"> <title>Don't index this page</title> </head>
القيم المحتملة لمحتوى الوسم الوصفي هي: "none" و"all" و"index" و"noindex" و"nofollow" و"follow". من الممكن أيضًا الجمع بين القيم،[1] على سبيل المثال:
يمكن تقييد توجيه noindex فقط على برامج بوت معينة عن طريق تحديد قيمة "name" مختلفة في الوسم الوصفي. على سبيل المثال، لحظر بوت غوغل على وجه التحديد،[3] حدد:
<meta name="googlebot" content="noindex">
أو، لحظر بوت بينغ، حدد:
<meta name="bingbot" content="noindex">
أو لحظر بوت بايدو، حدد:
<meta name="baiduspider" content="noindex">
يمكن استخدام ملف robots.txt لمنع الزحف.
من الممكن أيضًا استبعاد جزء من صفحة الويب، على سبيل المثال نص التنقل، من الفهرسة بدلًا من الصفحة بأكملها. هناك تقنيات مختلفة للقيام بذلك. من الممكن استخدام عدة معًا. من غير المعروف أن عنكبوت الفهرسة الرئيسي في غوغل، غوغل بوت، يتعرف على أي من هذه التقنيات.
قدم محرك البحث الروسي ياندكس وسم <noindex> جديدة تمنع فهرسة المحتوى بين العلامات. للسماح لكود المصدر بالتحقق من صحته، بدلاً من ذلك يمكن استخدام:[4]
<noindex>
<p> Do index this text. <noindex>Don't index this text.</noindex> <!--noindex-->Don't index this text.<!--/noindex--> </p>
تتعرف عناكب الفهرسة الأخرى أيضًا على وسم <noindex>، بما في ذلك أتومز.[5]
توجد مواصفات مسودة تنسيقات ميكروفورمات لعام 2005 بنفس الوظيفة. يبحث ملف تعريف استبعاد البوت عن السمة والقيمة "class=robots-noindex" في وسوم الإتش تي إم إل:[6]
"class=robots-noindex"
<p>Do index this text.</p> <div class="robots-noindex">Don't index this text.</div> <span class="robots-noindex">Don't index this text.</span> <p class="robots-noindex">Don't index this text.</p>
من الممكن أيضًا الجمع بين القيم، [6] على سبيل المثال:
<div class="robots-noindex robots-follow">Text.</div>
في عام 2007، قدمت ياهو! وظائف مماثلة للتنسيق المصغر في عنكبوتها. ومع ذلك، فإن عنكبوت ياهو! غير متوافق من حيث أنه يبحث عن قيمة class="robots-nocontent" وعن هذه القيمة فقط:[7]
class="robots-nocontent"
<p>Do index this text.</p> <div class="robots-nocontent">Don't index this text.</div> <span class="robots-nocontent">Don't index this text.</span> <p class="robots-nocontent">Don't index this text.</p>
يستبعد iFilter الخاص بشير بوينت 2010 المحتوى الموجود داخل وسم <div> مع السمة والقيمة class="noindex". لم تُستبعد عناصر <div> الداخلية في البداية، ولكن ربما تغير هذا. ومن غير المعروف أيضًا ما إذا كان من الممكن تطبيق السمة على علامات أخرى غير <div>.[8]
<div>
class="noindex"
<p>Do index this text.</p> <div class="noindex">Don't index this text.</div>
يستخدم جهاز بحث جوجل [الإنجليزية] التعليقات المنظمة:[9]
<p> Do index this text. <!--googleoff: all--> Don't index this text. <!--googleon: all--> </p>
تستخدم عناكب الفهرسة الأخرى أيضًا تعليقاتها المنظمة.
Need to prevent parts of individual pages from being searched? If you want to exclude portions of a page from indexing, surround the text with <noindex> and </noindex> tags. This is useful, for example, if you want to exclude navigation text from searches.