SHLUKOVÁNÍ VÁGNĚ DEFINOVANÍCH OBJEKTŮ

 

Jeden ze způsobů zpracování nepřesných dat

 

Libor Žák

 

Úvod

V běžném životě i technické praxi se často setkáváme s problémem, že máme k dispozici data, která mají popisovat nějaký děj, strukturu, uspořádání nebo jinou část reálného světa a potřebujeme vhodným způsobem tyto data vyhodnotit. Tento článek se zabývá daty, která jsou nepřesná, nebo jsou vyjádřena vágními pojmy. Jako metodu pro vyhodnocení těchto dat používáme shlukovou analýzu, která je součástí (v poslední době často zmiňovaného) termínu “data mining”. Protože nepřesnost a vágnost v datech budu vyjadřovat pomocí fuzzy množin, lze tento článek také zařadit do oblasti soft computing.

Někdo by mohl namítnout, že při stále dokonalejších technických prostředcích budou data přesnější a není tedy potřeba uvažovat o nepřesných či vágních pojmech. Opak je však pravdou. Protože popis reálného světa se k nám dostává zprostředkovaně přes naše smysly nebo přes hodnoty z měřicích přístrojů, může být tento popis nepřesný, neboť naše smysly jsou nedokonalé a měřicí přístroje mají konečnou přesnost měření. Některé objekty dokonce nelze z jejich podstaty přesně změřit a musíme tedy přejít k vágnějšímu popisu. Např. je-li objektem člověk a chceme popsat jeho charakteristické vlastnosti, musíme k popisu použít vágnějších pojmů používaných v přirozeném jazyce. Pokud již máme objekt popsán více či méně nepřesnými (vágními) pojmy, pak naším úkolem je z takto získaných dat odvodit požadovanou informaci.

Jednou z metod, jak získat požadovanou informaci, je nad danými daty (objekty) provést shlukování. Shlukování má za úkol roztřídit množinu objektů do menších celků podle vhodných charakteristických rysů. Hlavní obtíží, na kterou narazíme, budeme-li chtít takovou situaci matematicky modelovat je mimo jiné nutnost klasifikovat zkoumané věci a jevy na základě jejich podobnosti. Protože posuzování vzájemných podobností bylo a je záležitostí diskutabilní, začaly se s rozvojem výpočetní techniky objevovat pokusy o matematické podchycení a vyhodnocení míry těchto podobností. Hledaly se vhodné metody číselného vyjádření vlastností, jimiž se zkoumané objekty vyznačovaly, metody kvantitativního vyjádření podobností takto zakódovaných objektů a konečně metody seskupování podobných objektů do “shluků”. Tak začaly pokusy s řadou metod, které dnes podle společného cíle zahrnujeme pod název shluková analýza nebo zkráceně shlukování.

V literatuře se objevuje takové množství shlukovacích metod, že je obtížné je nějak rozumně utřídit. Protože shluková analýza má sloužit jako prostředek k získání klasifikace, nabízí se možnost rozlišovat shlukovací metody nikoli podle použitých matematických prostředků, ale podle cílů, k nimž směřují. Takto rozlišujeme dvě základní skupiny metod shlukové analýzy, a to hierarchické a nehierarchické metody, z nichž první směřují k hierarchické klasifikaci, druhé k nehierarchické klasifikaci.

Další významnou etapou v rozvoji shlukové analýzy je uplatnění fuzzy množin ve shlukovacím procesu. Tyto metody nazýváme fuzzy shlukovací metody nebo zkráceně fuzzy shlukování. Nejznámější a nejpoužívanější je fuzzy shlukování definované J.C. Bezdekem.

Všechny výše zmíněné typy shlukování pracují s objekty, jejichž popis v sobě neobsahuje neurčitost, vágnost. Jak již bylo řečeno výše, existují ale objekty, které nelze popsat jinak, než s určitou mírou vágnosti. Na tyto objekty nelze použít známé shlukovací metody.

Nedostatečnost klasického shlukování

Objekty, které shlukujeme pomocí klasického shlukování, jsou popsány pomocí znaků. Znaky objektů mohou nabývat tří základních typů:

i) kvantitativní: hodnota znaku vyjadřuje množství. Nejčastěji je znak tohoto typu popsán číslem patřícím do spočetné či nespočetné množiny Uj. Často Uj = R a objekty lze zobrazit jako body v prostoru Rm.

ii) kvalitativní: hodnota znaku je vybrána z konečné množiny možných stavů Xj. Hodnoty těchto znaků mohou být i disjunktní intervaly.

iii) binární: hodnota znaku je vybrána z dvouprvkové množiny, kde jeden prvek znamená, že objekt nemá požadovanou vlastnost a druhý znamená, že danou vlastnost má. Nejčastěji se tato dvouprvková množina definuje ve tvaru {0, 1}.

Popis objektu může obsahovat i kombinaci typů znaků i), ii), iii).

Výše uvedené typy znaků objektu předpokládají, že pro daný objekt je třeba vybrat jednu konkrétní hodnotu. Pokud vybranému znaku zvoleného objektu přiřadíme hodnotu, pak daný objekt ve vybraném znaku již nemůže nabývat další hodnoty. Znaky objektu a tím i zvolený objekt jsou přesně definovány a nad těmito objekty je definováno shlukování. Takové objekty budeme nazývat klasické objekty a shlukování nad nimi shlukování klasických objektů nebo klasické shlukování.

V praxi se často vyskytují objekty, které nelze popsat výše uvedenými typy znaků. Takový objekt obsahuje znak, jehož hodnoty nelze přesně definovat (tj. existuje znak objektu, který může současně obsahovat více hodnot a nebo pro daný znak existuje “neurčitost”, “vágnost” ve vyjádření hodnot tohoto znaku). Pak klasické shlukování nelze aplikovat přímo na takové typy objektů. V klasickém shlukování se tento případ řeší tím, že dané “vágní” hodnotě znaku přiřadíme hodnotu, která nejlépe vystihuje daný znak objektu. Vybere se tzv. “hlavní hodnota”. Tím, že z celé “vágní” hodnoty vybereme pouze tuto “hlavní hodnotu”, nebo ze všech možných hodnot vybereme pouze jednu hodnotu, ztrácíme informaci, která je obsažena ve “vágnosti” a která může mít na výsledek shlukování vliv.

Zobecnění typů znaků objektů

Bylo by vhodné zavést takové typy znaků objektů a shlukování nad těmito objekty, které by braly zřetel i na tuto “vágnost”. Je tedy užitečné “vágnost” použít při popisu hodnot znaku a tím ji zapojit do shlukovacího procesu. Existuje více možností, jak “vágnost” popsat. Protože člověk dokáže třídit i objekty, popis jejichž znaků je “vágní”, je vhodné vybrat takový popis “vágnosti” hodnot znaků, který se nejvíce přibližuje lidskému uvažování. Jak se již ukázalo v podobných oblastech, kde se snažíme nahradit lidský vliv na řešení problémů, je vhodné tuto "vágnost" popsat pomocí fuzzy množin. Takto definované hodnoty znaků objektů, kromě popisu vágnosti, zobecní hodnoty znaků klasických objektů.

Objekty popsané fuzzy množinami budu nazývat fuzzy objekty. Tyto fuzzy objekty mohou být popsány také pomocí jazykových hodnot předem definovaných jazykových proměnných. Ke shlukování se využívá zobecnění standardních shlukovacích metod, kde se místo podobnosti (nepodobnosti) objektů zavádí pojem fuzzy podobnosti (fuzzy nepodobnosti) fuzzy objektů a s využitím tohoto pojmu je definováno shlukování nad fuzzy objekty. Mou snahou je, aby se proces shlukování nad “vágnímí” objekty co nejvíce přiblížil shlukování chápanému intuitivně.

 

Předložený článek je součástí řešení výzkumného záměru CEZ: J22/98:261100009 “Netradiční metody studia komplexních a neurčitých systémů”.

 

 

Pro podrobnější popis fuzzy objektů a jejich shlukování si lze stáhnout PDF soubor: F_Shluk.pdf (144k), kde je matematický popis fuzzy objektů a základní požadavky pro jejich shlukování. Pro bližší zájem rád odpovím na Vaše dotazy na adrese zak@um.fme.vutbr.cz nebo na elzet@volny.cz. Uvítal bych, pokud by měl někdo zájem tento způsob získávání informací z nepřesných (vágních) dat aplikovat na konkrétní příklad. Jedná se hlavně o oblasti pracující s vágními daty, jako například v medicíně, psychologii, sociologii, ale i v některých technických oblastech.

 

Těším se na Vaše podněty a dotazy,

 

Libor Žák.




Zde je možno stáhnou novější přehled týkající se klasického shlukování a hlavně shlukování využívající fuzzy množin. Jedná se o články, které vyšli v časopise Automatizace, ročník 2004, číslo 3 - 6.

Automatizace 2004 číslo 3
Automatizace 2004 číslo 4
Automatizace 2004 číslo 5
Automatizace 2004 číslo 6



SHLUKOVÁNÍ VÁGNĚ DEFINOVANÍCH OBJEKTŮ