بایگانی کامپیوتر

alternative text

عنوان بخش دوم مقاله هست: تنها گروهی که می‌تواند همه چیز را دسته بندی کند، همه‌کس است.

  • همان‌گونه که کتاب‌ها شماره استاندارد بین‌المللی کتاب (ISBN) دارند، محتواهای موجود در وب را نیز می‌توان به وسیله آدرسشان (URL) از یکدیگر متمایز کرد. ارجاع از این طریق یا مستقیم است، مانند استفاده از آدرس برای پیوند به محتوای یک صفحه، و یا غیر مستقیم است، مانند استفاده از آدرس یک صفحه از سایت آمازون برای ارجاع به یک کتاب.
  • پس از این‌که بدین ترتیب برای هر موجودیت یک شناسه در نظر گرفتیم، می‌توان آنٰها را برچسب‌گذاری کرد تا قابل استفاده‌تر شوند. بدون این‌که نیازی به سامان‌دهی و دسته‌بندی سلسله مراتبی باشد.
  • سایت del.icio.us مکانی است که کاربران می‌توانند برای مدیریت آدرس‌های اینترنتی که به آن‌ها مکرر سر می‌زنند، استفاده کنند. هر کاربر می‌تواند پیوندی به یک صفحه وب را اضافه کند و تعدادی برچسب دلخواه به آن اضافه کند. هر برچسب شامل یک واژه یا عبارتی کوتاه است.
  • هیچ قاعده و محدودیتی برای اضافه کردن برچسب‌ها وجود ندارد. در عوض با هزینه بسیار کمی امکان استفاده از حجم وسیعی از سامان‌دهی که توسط کاربران انجام می‌شود، به‌وجود می‌آید.
  • با حذف قفسه‌ها و ساختار درختی دسته‌ها، به سمت «منطق بازار» حرکت می‌کنیم که در آن با انگیزه فردی، ولی منفعت جمعی سر و کار داریم. در مورد نمونه del.icio.us ، دسته‌بندی هر فرد به طور مجزا کم‌ارزش‌تر از دسته‌بندی یک حرفه‌ای است ولی تعداد این دسته‌بندی‌های مجزا بسیار بسیار بیشتر است. کافیست کاری کنیم که دسته‌بندی توسط هر شخص برای خودش مفید باشد. بدین ترتیب در طول زمان، حاصل ترکیب این دسته‌بندی‌های مجزا، بسیار ارزان‌تر و ارزشمندتر از این خواهد بود که به یک حرفه‌ای بگویید فقط برای یک بار مطالب شما را دسته‌بندی کند.
  • در این روش سلایق و روش‌های مختلف می‌توانند کنار یکدیگر وجود داشته باشند. بدون شک اختلاف نظرهایی بین افراد مختلف وجود دارد. افراد می‌توانند به مرور اشخاصی را به گروه خود اضافه یا کم کنند و حاصل ترکیب برچسب‌گذاری و دسته‌بندی بین خودشان را دنبال کنند.
  • روش‌های سامان‌دهی سنتی، با بزرگ شدن دچار مشکلاتی از قبیل دشواری پشتیبانی و مدیریت تغییرات در طول زمان می‌شوند. در عوض، شیوه برچسب‌گذاری، باز بزرگ‌تر شدن و مشارکت طیف وسیع‌تری از نظرات برآیند بهینه‌تری خواهد داشت.
  • برخلاف انتشار مجلات که ارزش‌گذاری پیش از انتشار توسط سردبیر صورت می‌پذیرد، در وب پس از انتشار است که محتواها به اندازه‌ای که مورد ارجاع قرار می‌گیرند ارزش‌گذاری می‌شوند و سردبیر آن نیز «همه کس» است. مشابه این قضیه در مورد دسته‌بندی نیز صادق است. مطالب پس از انتشار در وب توسط کاربران دسته‌بندی می‌شوند.
  • ادغام بانک‌های دسته‌بندی در سطح URL انجام می‌شود، نه دسته‌ها. این‌گونه نیست که دسته‌ها را ثابت بگیریم و آدرس محتواهای مرتبط را ذیل دسته‌ها قرار دهیم، بلکه در عوض آدرس‌ها را با هم ادغام کرده و سپس به تشابه بین برچسب‌ها می‌پردازیم.
  • ادغام دسته‌بندی‌ها به این شیوه، تنها موجب همپوشانی بین برچسب‌ها می‌شود(زیرا برچسب‌گذاری کاربران مختلف برای یک آدرس لزوما مشابه نیست). به همین خاطر مفهومی مشابه برچسب‌های مترادف نخواهیم داشت. در عوض با مشاهده برچسب‌هایی که همواره کنار یکدیگر ظاهر می‌شوند، می‌توان به مفهومی با عنوان برچسب‌های مرتبط با هم رسید.
  • در ادامه، نگارنده مقاله با اشاره به چند نمودار آماری در خصوص برچسب‌گذاری پیوندهای مختلف در سایت del.icio.us تحلیل‌های مفیدی در خصوص پراکندگی آماری برچسب‌ها و مفهوم آن ارائه می‌کند.
  • با این روش از منطق دودویی در دسته‌بندی فاصله خواهیم گرفت. از این پس خواهیم گفت N% کاربران بر این باورند که این موجودیت در این دسته (برچسب) قرار می گیرد[مجموعه‌های فازی و منطق فازی(؟)].
  • و در نهایت به این سوال فلسفی خواهیم رسید که آیا دنیا به خودی خود معنادار است و یا این‌که ما به آن معنا می‌بخشیم؟

alternative text

مقاله به هستی‌شناسی بیش از اندازه بها داده شده: دسته‌ها، پیوندها و برچسب‌ها بر اساس دو سخنرانی که کلی شیرکی در حدود چهار سال پیش ایراد کرده است، تنظیم شده. این مقاله را تا هفته پیش ندیده بودم. خواندن آن از این رو برایم جالب بود که تمام پیش‌بینی‌ها و پیشنهادهایش امروزه در دنیای اینترنت و رایانه تحقق یافته و خود من ناخودآگاه از این شیوه استفاده می‌کنم. خلاصه عنوان‌واری از این مقاله را برای کسانی که علاقه‌مند هستند و البته رجوع خودم در آینده طی دو پست این‌جا می‌گذارم:

  • هدف این مقاله این است که بگوید عمده‌ی روش‌هایی که برای دسته‌بندی می‌شناسیم نادرست اند و برای محتواهای الکترونیک ناجور هستند.
  • هدف اصلی هستی‌شناسی (آنتولوژی) مطالعه موجودات و رابطه آن‌هاست. سوال این است که چه چیزهایی وجود دارند و یا می‌توانند وجود داشته باشند و چه نوع روابطی می‌تواند بین آن‌ها برقرار باشد.
  • دسته‌بندی عمل سامان‌دهی تعدادی موجودیت (چه اشیاء و چه مفاهیم) در گروه‌هایی مربوط به هم است.
  • دسته‌بندی هستی‌شناسانه سامان‌دهی مجموعه‌ای از موجودیت‌ها در تعدادی گروه است، بر اساس ماهیت و رابطه آن‌ها با یکدیگر (به عنوان نمونه یک کتاب‌دار برای یک کتاب جدید، حتی پیش از چاپ آن یک دسته مشخص در کتاب‌خانه دارد)
  • این نوع دسته‌بندی مشکل‌دار است زیرا هیچ‌گاه نظام دسته‌بندی‌ای که چنین کامل و بی‌نقص باشد در عمل وجود ندارد.
  • جدول تناوبی عناصر در شیمی شاید بهترین نمونه چنین دسته‌بندی‌ای است. حتی در این نمونه تقریبا کامل ایراداتی وجود دارد. به عنوان مثال ستون سمت راست این جدول را «گازهای نجیب» نام‌گذاری کرده‌اند. این در حالی است که هلیم «ماهیتاً» یک گاز نیست و در دماهای پایین‌تر مانند هر چیز دیگری به مایع تبدیل می‌شود. به دلیل نبود اندازه‌گیری‌های دقیق، در گذشته گاز بودن جزء ماهیت این عناصر فرض گرفته شده است که صحیح نیست.
  • مسئله در مواردی که دسته‌بندی برخلاف نمونه جدول تناوبی به ویژگی‌های ملموس فیزیکی مربوط نیست مشکل‌تر نیز می‌شود.
  • مثال دیگر دسته‌بندی کتاب‌ها در کتاب‌خانه است. با گذشت زمان برخی دسته‌بندی‌ها معنای خود را از دست می‌دهند (مانند دسته‌های مختلف کتاب‌ها پیش و پس از فروپاشی شوروی سابق). گاهی تعداد کتاب‌ها در قفسه‌ها دسته‌های رده اول در کتاب‌خانه را مشخص می‌کنند. مثلاً در کتاب‌خانه کنگره امریکا برای حوزه بالکان یک عنوان در رده دسته‌های اصلی در جغرافیا قرار گرفته و برای کل آسیا نیز یک دسته!
  • یاهو (Yahoo) اولین تلاش را برای دسته‌بندی مطالب در وب انجام داد. ابتکاری که یاهو انجام داد این بود که در دسته‌بندی‌هایش پیوندهایی به دسته‌های دیگر قرار داد. به عنوان نمونه در دسته سرگرمی، علاوه بر موسیقی و فیلم و …، دسته‌ای به نام «کتاب و ادبیات» نیز وجود دارد که با علامتی (@) متمایز شده است. یاهو می‌گوید از آن‌جایی که ما بهتر از شما می‌دانیم دنیا چگونه ‌دسته‌بندی شده، می‌دانیم که کتاب و ادبیات زیر مجموعه علوم انسانی است. اما از آن‌جایی که شما ممکن است اشتباهاً تصور کنید که زیرمجموعه سرگرمی است، ما با یک پیوند شما را به جای درست هدایت می‌کنیم.
  • یاهو با این ابتکار محدودیت فیزیکی قفسه‌های کتاب را برداشت. علاوه بر این‌که تعداد متفاوتی موجودیت ممکن است به هر دسته تعلق داشته باشد، یک موجودیت می‌تواند در چند دسته مختلف نیز پدیدار گردد.
  • سلسله دسته‌ها و زیر دسته‌ها را به شکل یک ساختار درختی تصور کنید. کاری که یاهو کرد اضافه کردن تعدادی پیوند از بعضی شاخه‌های این درخت به برخی شاخه‌های دیگر بود.
  • یکی از دلایل موفقیت گوگل این بود که از این هم یک گام فراتر گذاشت و کل ساختار سلسله مراتب (درختی) را حذف کرد و آن را با پیوندها جایگزین کرد. در این روش موجودیت‌ها بر اساس ماهیت‌شان از پیش در دسته‌هایی مشخص قرار داده نمی‌شوند، بلکه طی هر جستجوی جدید، موجودیت‌های مرتبط از ساختار پیوندی (و نه سلسله مراتبی درختی) استخراج می‌شوند.
  • دسته‌بندی هستی‌شناسانه تنها در مواردی که مجموعه موجودیت‌ها کوچک است، دسته‌ها متمایزند، موجودیت‌ها پایدار هستند و محدود، می‌تواند پاسخ‌گوی نیاز ما باشد.
  • به‌علاوه، دسته‌بندی هستی‌شناسانه نیازمند این است که کاربران و کسانی که دسته‌بندی را انجام می‌دهند، آموزش دیده و حرفه‌ای باشند و منابع رسمی تصمیم‌گیری در صورت بروز اختلاف نظر وجود داشته باشد.
  • یکی از مشکلات اساسی از پیش دسته‌بندی کردن این است که اشخاصی که این کار را می‌کنند را مجبور می‌کند که دو کار غیر ممکن را انجام دهند: ذهن‌خوانی و پیشگویی.
  • برای از پیش دسته‌بندی کردن نیاز است که دانست منظور واقعی کاربران از هر واژه‌ای چیست (ذهن خوانی). در حالی که ممکن است کاربران مختلف از کلمات یکسان برداشت متفاوتی داشته باشند.
  • دسته‌بندی از پیش نیاز به پیش‌بینی آینده نیز دارد. زمانی شهر درسدن مربوط به دسته آلمان شرقی بود. درسدن هنوز موجود است ولی دسته آلمان شرقی دیگر اکنون وجود خارجی ندارد.

ادامه دارد …

در google چه می گذرد؟


یکی از بچه ها اینجا هست که یه کم آدم بدبینی هست. بدبین شاید واژه مناسبی نباشه بهتره بگم تئوری توطئه رو هم همیشه در امور زندگیش لحاظ می کنه. چند مرتبه در حال بحث که به گوگل و نحوه عملکردش رسیدیم گفت که به این گوگل و کارهاش مشکوک هست. یکی از دلایلش هم این بود که تو یه پروژه ای مثل اورکات چقدر ساده نه تنها دوستانت و علاقه هات (با توجه به اینکه عضو چه community هایی هستی) بلکه دوستان دوست هات و حتی اینکه دو تا آدم مختلف چگونه و از چه طریقی به هم مرتبط می شن رو اطلاعتش رو داره. البته این بحث رو من چند بار هم قبلا در مورد اورکات شنیده بودم ولی امروز دوباره ;که نگاه می کردم به نظرم می رسید توی همه پروژه های گوگل ردپای یه طرز تفکری رو می شه دید (یا حداقل اگر هم واقعا اینگونه نیست، می شه چسبوند!). بیان ساده اش این می شه: گوگل با ابزارهای عمدتا مجانیش کاری می کنه که تو ترغیب شی اطلاعات خودت و حتی اطلاعات شخصی خودت رو به روشی کاملا سازمندهی شده در اختیارش بگذاری. با استفاده از gmail تاریخچه ی از تمام مکاتبات شخص در اختیار گوگل قرار می گیره و با توجه به فضایی هم که در اختیار هست هیچ وقت پاک نمی شن. با استفاده از نوارابزار (toolbar) گوگل حتی سایت هایی که سر زدی و مورد بازبینی قراردادی به گوگل فرستاده می شن. قرارهای ملاقات و کارهای این هفته ات رو که می خوای انجام بدی در google calendar ثبت می کنی. عقاید و اعتقاداتت رو در blogger می نویسی. حتی اگر قبلا جایی بودی و عکسی از خودت روی هاردت هست که خودتم یادت رفته، picasa برات می گرده و پیداش می کنه و به راحتی می تونی از توی همون نرم افزار در google photos آپلودش کنی. برای اسناد متنی و sheetهای کاری excel هم سرویس google docs & spreedsheets در نظر گرفته شده تا اون ها رو هم در اختیار گوگل عزیز قرار بدی تا برات دسته بندی و مرتب کنه! این اواخر هم که google desktop آمده تا اگر خدایی نکرده روی هاردت توی سوراخ سمبه ای چیزی قایم شده بود برات سرچ کنه و index کنه. البته می دونیم که این گوگل دسکتاپ یه پاش آنلاینه و یه پاش آفلاین بنابراین دیتای شخصی شما و گوگل و این حرفا نداره که! به این لیست google talk و google persoalized homepage و چندین پروژه آزمایشگاهی دیگه ای که تو راهند رو اضافه کنید. تازه می گن سیستم عامل هم می خواد بده بیرون!
ولی اگر با عینک بدبینی به این قضیه نگاه نکنیم هوشمندی عجیبی پشت این قضیه هست که به زیبایی تمام داره به ما می گه بیایید من به شما کمک می کنم تمام اطلاعات زندگیتون رو ثبت کنید تا من اون ها رو به اضافه اطلاعات دیگری که احتمالا به دردتون می خوره، به صورت طبقه بندی شده و منظم هر وقت که بخواهید در اختیارتون بذارم!
پی نوشت: حتی اگر رسما از طرف گوگل می اومدن به من می گفتن آقا نیت ما اینه که اطلاعات شخصی مردم رو جمع آوری کنیم و اصلا همون فکر بدی که شما در مورد ما می کنی درست هست، حالا بگو حاضری این سرویس ها رو در اختیارت بذاریم؟ من شاید باز هم می گفتم آره!

همیشه جدیدتر بهتر نیست

Old and new.jpg
شاید گه تا دیروز به این سایت می رسیدم و شعار سردر سایتشون یعنی «because newer is not always better» رو می دیدم مسخره می کردم. اما وقتی بعد از مدت ها دوری از yahoo messenger وقتی به خاطر یه کاری مجبور شدم چند روز پیش نسخه جدیدش رو نصب کنم و دیدم کار نمی کنه، و تا همین امروز که نسخه قدیمیش رو پیدا نکردم کارم راه نیفتاده بود، فهمیدم آدم های حسابی کارهای ظاهرا مسخره شون هم دلیل داره.

 

About Author

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Vestibulum at arcu. Integer et risus. Morbi id tellus. Integer felis. Mauris malesuada, turpis vitae facilisis euismod, dui arcu adipiscing sem, eu vulputate leo ante in lacus. Sed porta accumsan lectus. Aenean ac sem. In consequat tempus velit. Phasellus leo enim, adipiscing a, egestas nec, pretium ut, pede. Mauris sollicitudin diam et mauris. Sed quis enim vel augue egestas lobortis. Etiam tempus ipsum vel neque.

اطلاعات