Вопросы классификации
Jul. 3rd, 2007 10:23 amМеня на днях спросили про классификацию, теги и всё такое прочее. Подумав, я выделил несколько видов классификации:
Categories
Категории, как правило призваны поделить множество классифицируемых объектов на более-менее близкие по размеру группы. При этом обычно эти группы не пересекаются и образуют из себя дерево. Поскольку техника классификации зависит от предметной области (чтобы дерево под-категорий было сбалансированным), то при построении таксономической структуры категорий её надо очень хорошо себе представлять. На крайняк - взять стандартную от Open Directory или Yahoo.
Keywords
Ключевые слова - это обычно слова/фразы, выбраные из описания объекта, по которым потом можно легко находить нужные объекты, делая срезы по выбранному ключевому слову. Впрочем, иногда ключевые слова используются наоборот - чтобы проассоциировать с текстом слова, не встречающиеся в нём, но семантически связаные с ним. Но в любом случае, ключевые слова затачиваются под последующий поиск по ним.
Facets
Фасеты - это разбиения объектов на группы по определённому признаку. При просмотре множеств объектов эти разбиения могут применяться в произвольном порядке (причём некоторые могут и не применяться). Пример: деление продуктов во Froogle (см.внизу).
Tags
Теги, вообще говоря, это просто некое слово или словосочетание, ассоциированное с классифицируемым объектом. В результате в общем множестве объектов выделяются пересекающиеся кластеры, над которыми в принципе можно работать методами теории множеств (хотя практических применений этого я не видел).
Громкий успех тегов на волне Web 2.0 объясняется довольно просто. Признаемся себе: создать хорошую схему классификации - сложно. Заставить (даже себя) заняться организацией тысяч объектов в полезных группы - практически невозможно. А вот попросить всех пользователей приписать каждому объекту несколько слов-тегов - несложно, особенно если у пользователей есть своя мотивация. Потом эти теги статистически обработали (вот пример моего облака ссылок) - и получили ad hoc классификацию, которая и работает за счёт статистики. Фолксономия во всей её красе. Яркий пример: del.icio.us.
А основная мораль всего этого - прежде чем заниматься классификацией чего-либо, надо задуматься и понять как будет работать эта классификация и какие цели она преследует.
no subject
Date: 2007-07-03 07:52 am (UTC)Я бы включил токо теги и иерархическую структуру. (якобы категории)
А если уж пошла такая пьянка, как фасеты, то имхо можно еще десяток включить подобных мелочей =)
no subject
Date: 2007-07-03 07:56 am (UTC)no subject
Date: 2007-07-03 08:06 am (UTC)То есть традиционно: ключевые слова - результат статистической обработки собственно каталогизируемого текста, а теги - результат статистической обработки данных от множества потребителей информации.
Ещё короче: ключевые слова навешиваешь ты, теги - все вместе.
no subject
Date: 2007-07-03 08:09 am (UTC)Видимо, многие современные сайты неправильно интерпретируют понятие «тег».
no subject
Date: 2007-07-03 08:09 am (UTC)А моей аудитории, думаю, этого вполне достаточно.
no subject
Date: 2007-07-03 08:19 am (UTC)полез в словари "фолксономический инструмент" - первый раз такое слово слышу ;-)
Андрюха кончай умничать ;-)
no subject
Date: 2007-07-03 09:01 am (UTC)no subject
Date: 2007-07-03 09:05 am (UTC)тоже раза три перечитывать пришлось =) списывал это на непроснувшийся организм.
no subject
Date: 2007-07-03 09:14 am (UTC)no subject
Date: 2007-07-03 09:15 am (UTC)no subject
Date: 2007-07-03 09:21 am (UTC)Суть изложена верно, линки правильные. Мне кажется не хватает, как бы это лучше сказать, популизма =) То есть можно было бы написать тоже самое более популярным языком.
no subject
Date: 2007-07-03 09:21 am (UTC)no subject
Date: 2007-07-03 10:23 am (UTC)Персонаж? Автор? Произведение? Чур, в гугли, рамблеры и тындексы не подглядывать! :)
no subject
Date: 2007-07-03 10:41 am (UTC)no subject
Date: 2007-07-03 02:05 pm (UTC)no subject
Date: 2007-07-03 02:10 pm (UTC)no subject
Date: 2007-07-03 02:20 pm (UTC)no subject
Date: 2007-07-04 07:13 am (UTC)Мне кажется, что передо мной катая-то огромная дверь в новые понимания мира: "Тук-тук, Сизам откройся".
no subject
Date: 2007-07-04 07:26 am (UTC)no subject
Date: 2007-07-04 07:29 am (UTC)Тогда понял, теория информации для необозримых объемов ;)