recoder: (Default)
[personal profile] recoder

Меня на днях спросили про классификацию, теги и всё такое прочее. Подумав, я выделил несколько видов классификации:

Categories

Категории, как правило призваны поделить множество классифицируемых объектов на более-менее близкие по размеру группы. При этом обычно эти группы не пересекаются и образуют из себя дерево. Поскольку техника классификации зависит от предметной области (чтобы дерево под-категорий было сбалансированным), то при построении таксономической структуры категорий её надо очень хорошо себе представлять. На крайняк - взять стандартную от Open Directory или Yahoo.

Keywords

Ключевые слова - это обычно слова/фразы, выбраные из описания объекта, по которым потом можно легко находить нужные объекты, делая срезы по выбранному ключевому слову. Впрочем, иногда ключевые слова используются наоборот - чтобы проассоциировать с текстом слова, не встречающиеся в нём, но семантически связаные с ним. Но в любом случае, ключевые слова затачиваются под последующий поиск по ним.

Facets

Фасеты - это разбиения объектов на группы по определённому признаку. При просмотре множеств объектов эти разбиения могут применяться в произвольном порядке (причём некоторые могут и не применяться). Пример: деление продуктов во Froogle (см.внизу).

Tags

Теги, вообще говоря, это просто некое слово или словосочетание, ассоциированное с классифицируемым объектом. В результате в общем множестве объектов выделяются пересекающиеся кластеры, над которыми в принципе можно работать методами теории множеств (хотя практических применений этого я не видел).

Громкий успех тегов на волне Web 2.0 объясняется довольно просто. Признаемся себе: создать хорошую схему классификации - сложно. Заставить (даже себя) заняться организацией тысяч объектов в полезных группы - практически невозможно. А вот попросить всех пользователей приписать каждому объекту несколько слов-тегов - несложно, особенно если у пользователей есть своя мотивация. Потом эти теги статистически обработали (вот пример моего облака ссылок) - и получили ad hoc классификацию, которая и работает за счёт статистики. Фолксономия во всей её красе. Яркий пример: del.icio.us.


А основная мораль всего этого - прежде чем заниматься классификацией чего-либо, надо задуматься и понять как будет работать эта классификация и какие цели она преследует.

Date: 2007-07-03 07:52 am (UTC)
From: [identity profile] akeepaki.livejournal.com
Как-то мало вариантов =).
Я бы включил токо теги и иерархическую структуру. (якобы категории)

А если уж пошла такая пьянка, как фасеты, то имхо можно еще десяток включить подобных мелочей =)

Date: 2007-07-03 09:01 am (UTC)
From: [identity profile] akeepaki.livejournal.com
кому надо, уже ходил и читал в более удобоваримых русскоязычных источниках =). Важны же не длинные слова и как что обзывается, а суть! :)

Date: 2007-07-03 09:21 am (UTC)
From: [identity profile] akeepaki.livejournal.com
Почему сразу претензии? :)
Суть изложена верно, линки правильные. Мне кажется не хватает, как бы это лучше сказать, популизма =) То есть можно было бы написать тоже самое более популярным языком.

December 2024

S M T W T F S
1234567
891011121314
15161718192021
22232425 262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 24th, 2025 03:37 pm
Powered by Dreamwidth Studios