فرکانس سند معکوس و اهمیت منحصر به فرد
در آخرین ستون خود ، درباره نحوه استفاده از تجزیه و تحلیل فرکانس مدت نوشتم در ارزیابی محتوای خود در مقابل رقابت. فراوانی اصطلاح (TF) تنها بخشی از رویکرد TF-IDF برای بازیابی اطلاعات است. بخش دیگر فرکانس اسناد معکوس (IDF) است ، چیزی که من امروز قصد دارم در مورد آن بحث کنم.
پست امروز از توضیحی در مورد نحوه عملکرد IDF برای نشان دادن اهمیت ایجاد محتوایی که دارای منحصر به فرد واقعی است استفاده می کند. دلایل شهرت و دید برای انجام این کار وجود دارد ، و برای کاربران عالی است ، اما مزایای سئو نیز وجود دارد.
اگر تعجب می کنید که چرا من روی TF-IDF تمرکز می کنم ، این کلمات را از مقاله Google از آگوست ۲۰۱۴ : “این ایده TF-IDF معروف است که مدتهاست برای فهرست بندی صفحات وب استفاده می شود.” در حالی که نحوه استفاده گوگل از این مفاهیم بسیار بیشتر از مدلهای ساده TF-IDF است که من در مورد آنها صحبت می کنم ، ما هنوز می توانیم چیزهای زیادی از درک اصول نحوه عملکرد آنها بیاموزیم.
فرکانس سند معکوس چیست؟
به عبارت ساده ، اندازه گیری نادر بودن یک اصطلاح است. از نظر مفهومی ، ما با اندازه گیری فرکانس سند شروع می کنیم. ساده تر است که با یک مثال توضیح دهید ، به شرح زیر:
در این مثال ، می بینیم که کلمه “a” در هر سند در مجموعه سند ظاهر می شود. چیزی که این امر به ما می گوید این است که هیچ ارزشی در تفکیک اسناد ندارد. در همه چیز هست
حالا به کلمه “mobilegeddon” نگاه کنید. در ۱۰۰۰ سند یا یک هزارم یک درصد آنها آمده است. واضح است که این عبارت تمایز بیشتری برای اسناد حاوی آنها ایجاد می کند.
فراوانی سند مشترک بودن را اندازه گیری می کند و ما ترجیح می دهیم کمیابی را اندازه گیری کنیم. روش کلاسیک انجام این کار با یک فرمول به این شکل است:
برای هر اصطلاحی که در حال بررسی آن هستیم ، تعداد کل اسناد موجود در سند تنظیم شده را برداریم و بر تعداد اسناد حاوی عبارت ما تقسیم می کنیم. این به ما میزان کمیابی را بیشتر می دهد. با این حال ، ما نمی خواهیم در محاسبه به دست آمده گفته شود که کلمه “mobilegeddon” در تشخیص سند ۱۰۰۰ برابر کلمه “قایق” مهمتر است ، زیرا این یک عامل مقیاس بندی بسیار بزرگ است.
این به این دلیل است که ما Log Base 10 از نتیجه را می گیریم تا این محاسبه را کاهش دهد. برای شما که ریاضیدان نیستید ، می توانید Log Base 10 یک عدد را یک عدد صفر بدانید – یعنی Log Log 10 از ۱،۰۰۰،۰۰۰ ۶ است ، و log log 10 از ۱۰۰۰ ۳٫ بنابراین به جای این که بگویید کلمه “mobilegeddon” 1000 برابر مهمتر است ، این نوع محاسبه نشان می دهد که آن سه برابر مهمتر است ، که بیشتر با آنچه از دید موتور جستجو منطقی است منطبق است.
با در نظر گرفتن این موارد ، در اینجا مقادیر IDF برای اصطلاحاتی که قبلاً بررسی کردیم آمده است:
اکنون می بینید که ما بالاترین نمره را به اصطلاح نادرترین ارائه می دهیم.
مفهوم IDF به ما چه می آموزد؟
به IDF به عنوان معیار منحصر به فرد بودن فکر کنید. این به موتورهای جستجو کمک می کند تا تشخیص دهند که چه چیزی یک سند خاص را خاص می کند. این باید بسیار پیچیده تر از تعداد دفعاتی باشد که از یک عبارت جستجو شده استفاده می کنید (به عنوان مثال تراکم کلمات کلیدی).
اینطور فکر کنید: اگر شما یکی از ۶٫۷۸ میلیون وب سایتی هستید که برای جستجوی “super bowl 2015” مطرح می شوند ، با یک زمین بازی شلوغ سروکار دارید. شانس شما برای رتبه بندی این عبارت بر اساس کیفیت محتوای شما تقریباً صفر است.
به طور کلی قدرت پیوند و سایر سیگنال ها تنها راهی است که می توانید برای یک عبارت رقابتی رتبه بندی کنید. اگر شما یک سایت جدید در منظره هستید ، خوب ، شاید باید چیز دیگری را دنبال کنید.
این سوال را برای ما ایجاد می کند که چه چیزی را باید هدف قرار دهید.چیزی منحصر به فرد چطور؟ حتی افزودن یک کلمه ساده مانند “پیش بینی ها” – تبدیل عبارت ما به “پیش بینی های فوق العاده ۲۰۱۵” – این زمین بازی را به ۱۷۸۰۰ نتیجه کاهش می دهد.
واضح است که در حال حاضر به طور چشمگیری رقابتی کمتر است. با جمع بندی بیشتر ، عبارت “پیش بینی ها و شانس های فوق العاده ۲۰۱۵” تنها ۲۶ صفحه را در گوگل باز می گرداند. ببینید به کجا میرسد؟
آنچه IDF به ما می آموزد اهمیت منحصر به فرد بودن محتوایی است که ایجاد می کنیم. بله ، در صورت کسب رتبه بزرگ در دوره ریاست جمهوری ، تقریباً به اندازه پول شما به شما پرداخت نمی شود ، اما اگر کسب و کار شما به تازگی وارد فضای بسیار شلوغی شده باشد ، شما برای رتبه های بزرگ رتبه ای نخواهید داشت. در هر صورت سر
اگر بتوانید تعداد کمتری از اصطلاحات را با رقابت بسیار کمتر انتخاب کنید و محتوای مورد نیاز خود را ایجاد کنید ، می توانید برای این شرایط رتبه بندی کنید و پول را به کسب و کار خود وارد کنید. این امر به این دلیل است که شما با استفاده از ترکیبات نادرتر از اصطلاحات (با استفاده از آنچه IDF به ما می آموزد) از محتوای خود منحصر به فردتر می شوید.
خلاصه
افرادی که تجزیه و تحلیل کلمات کلیدی را انجام می دهند ، اغلب بر اساس اصول اصلی اصلی ، به سادگی بر اساس حجم جستجوی کلمات کلیدی موجود ، متصل می شوند. در واقع نتیجه این رویکرد می تواند بسیار مأیوس کننده باشد.
درک نحوه عملکرد فرکانس معکوس به ما کمک می کند اهمیت برجسته بودن را درک کنیم. ایجاد محتوا که زوایای منحصر به فردی را برای میز به ارمغان می آورد اغلب یک راه بسیار قوی برای شروع استراتژی سئو شما است.
البته دلایل ایجاد محتوای بسیار متفاوت و منحصر به فرد بسیار فراتر از سئو است. این برای کاربران شما خوب است و برای شهرت ، دید و سئو شما نیز مفید است.