Teoretické aspekty vyhledávání informací
Výběrová tematická rešerše webovských veřejně dostupných dokumentů

Zpracovatelé: Jana Kábrtová a Ondřej Pečený

1. ADRIANI, Mirna
Dictionary-based CLIR for the CLEF Multilingual Track [online]. Glasgow : Department of Computing Science, University of Glasgow, [cit. 2001-06-29]. Cross-Language Evaluation Forum.
URL: http://www.iei.pi.cnr.it/DELOS/CLEF/adriani.pdf

Zpráva popisuje participaci na programu Cross-Language Evaluation Forum (CLEF) za účelem lepšího porozumění otázkám z oblasti Cross-Language Information Retrieval (CLIR). Dotazy v angličtině jsou na základě online slovníku překládány do němčiny, francouzštiny a italštiny. Je pak uplatněna technika odstranění dvojznačnosti termínů a technika rozšíření dotazu.

2. BELKIN, Nicholas J.
An Overview of Results from Rutgers' Investigations of Information Retrieval [online]. New Brunswick, NJ : Rutgers University, School of Communication, Information and Library Studies, [1997]. TIPSTER Phase III Research Project
URL: http://mariner.rutgers.edu/tipster3/cladp97.html

    Článek shrnuje výsledky série výzkumů Information Interaction Laboratory na Rutgers' Studies, které se zabývaly různými aspekty interakce člověka a progresivních IR systémů.

3. BERRY, Michael W.; DUMAIS, Susan T.; LETSCHE, Todd A.
Computational Methods for Intelligent Information Access [online]. [1995].
URL: http://www.cs.utk.edu/~berry/sc95/sc95.html

    Popisuje metodu latentního sémantického indexování (LSI) jako řešení asociativního vztahu mezi termíny a dokumenty. Tato metoda byla vyvinuta speciálně pro IR aplikace.

4. BYRD, Donald; PODOROZHNY, Rodion
Adding Boolean-quality control to best-match searching via an improved user interface [online]. Amherst (MA) : Center for Intelligent Information Retrieval, Computer Science Department, University of Massachusetts, 2000-05-01 [cit. 2001-06-29].
URL: http://ciir.cs.umass.edu/pubfiles/ir-210.pdf

Tato technická zpráva pojednává o navrhovaném textovém vyhledávacím systému MIRV, který by měl mít pro experty kvalitu booleovského vyhledávání za současného zjednodušení dotazu a měl by být zároveň dostupný i pro běžné uživatele, kteří mají ve větší oblibě formulaci dotazu v tzv. "přirozeném jazyce" (autoři používají označení "free-text").

5. CROFT, W. Bruce
What Do People Want from Information Retrieval? D-Lib Magazine [online]. 1995, vol. 1, no. 5
URL: http://www.dlib.org/dlib/november95/11croft.html . ISSN 1082-9873

    Článek kritizuje stávající systémy IR, využívající booleovské logiky, a zaměřuje se na textově orientované systémy. Popisuje nové metody vyhledávání, např. multilingual IR, data mining v textových databázích, kategorizaci textu apod.

6. FUHR, Norbert
Information Retrieval : Skriptum zur Vorlesung [online]. Dortmund : Universitaet Dortmund 1998.
URL: http://ls6-www.informatik.uni-dortmund.de/ir/teaching/courses/ir/script/irskall.ps.gz

    Jde o univerzitní skriptum. Prvních pět kapitol je psáno v němčině, zbytek v angličtině. Skriptum se zabývá reprezentací textu, dále jak pravděpodobnostními, tak ne-pravděpodobnostními modely vyhledávání informací, modely založenými na predikátové logice, vztahem vyhledávání informací a databází a interaktivními informačními systémy. Plný text dokumentu je dostupný jako komprimovaný postscriptový soubor.

7. FUHR, Norbert
Probabilistic Datalog - a Logic for Powerful Retrieval Methods. In Proceedings of the 18th AnnualInternational ACM SIGIR Conference on Research and Development in Information Retrieval [online]. Chapel Hill, NC : ACM SIGIR, 1995
URL: http://ls6-www.cs.uni-dortmund.de/ir/publications/1995/Fuhr:95a.html

    Článek prezentuje inferenční metodu, kombinující Datalog s teorií pravděpodobnosti na základěintenzionální sémantiky. Toto pojetí dovoluje snadnou formulaci specifických modelů vyhledávání pro libovolné aplikace, a také umožňuje (při specifikaci vhodných pravidel) implementaci klasických modelů pravděpodobnostního informačního vyhledávání. Na rozdíl od ostatních pojetí, pravděpodobnostní Datalog lze použít také jako dotazovací jazyk pro integraci IR a databázových systémů. Plný text dokumentu je dostupný jako komprimovaný postscriptový soubor (Fuhr-95a.ps.gz).

8. FUHR, Norbert; Rölleke, T.
A Probabilistic Relational Algebra for the Integration of Information Retrieval and Database Systems [online]. 1997.
URL: http://ls6-www.cs.uni-dortmund.de/ir/publications/1997/Fuhr_Roelleke:94.html

    V tomto dokumentu je prezentován pravděpodobnostní datový model, který je základem relací ve formách NF2 (non-first-normal-form). V tomto modelu se přiřazují sadám atributů pravděpodobné ohodnocení relací. Pro information retrieval jsou tyto sady indoxovaných termů z dokumentů datovou bází, ve které se vyhledává podobně jako v tradičních relačních databázích.(Fuhr_Roelleke_94_ps.gz)

9. FUHR, Norbert
Models for Integrated Information Retrieval and Database Systems [online]. 1996.
URL: http://ls6-www.cs.uni-dortmund.de/ir/publications/1996/Fuhr:96b.html

    Tento příspěvek ukazuje na nesoulad mezi IR a databázovými koncepty, a navrhuje také řešení tohoto problému. Databázově orientované přístupy musí rozlišovat mezi logickou a obsahovou strukturou objektů a měly by uvažovat také plánovanou strukturu. Nezávislosti dat - dříve v IR neuvažované - může být dosaženo užitím pojmu nejasných predikátů. Pro tyto účely prezentuje autor pravděpodobnostní relační algebru. Plný text dokumentu je dostupný jako komprimovaný postscriptový soubor (Fuhr:96b.ps.gz).

10. GÖVERT, Norbert
Evaluierung eines entscheidungstheoretischen Modells zur Datenbankselektion. In Hypertext -- Information Retrieval -- Multimedia (HIM). Theorien, Modelle und Implementierungen integrierter elektronischer Informationssysteme [online]. Dortmund : Universitat Dortmund, Lehrstuhl Informatik, 1997. [cit. 2001-06-29].
URL: http://ls1-www.cs.uni-dortmund.de/HIM97/Konferenzband/Goevert.pdf

    Centrálním problémem síťového vyhledávání informací je výběr databáze. Které databáze by měly být vzaty v úvahu, aby pokryly informační potřeby uživatelů? Pokud vycházíme z modelu teorie rozhodování, ukazuje se jako fundamentální pro výběr databáze určení počtu relevantních dokumentů. Článek se snaží odhadovat tento parameter, a prezentuje srovnání těchto odhadů.

11. LESK, Michael
The Seven Ages of Information Retrieval [online]. Latest rev. June 17, 1995. UDT Occasional Paper #5
URL: http://www.ifla.org/VI/5/op/udtop5/udtop5.htm

    Tato stať byla uveřejněna v edici pracovní skupiny jednoho z klíčových programů IFLA: UDT = Universal Dataflow and Telecommunications; dokumentuje vývoj vyhledávání informací (information retrieval) jako samostatné vědecké disciplíny, od roku 1945 do roku 1995. Kromě milníků jako KWIK rejsříky, první počítače, full text či multimédia, jsou pojmenovány problémové okruhy dalšího vývoje IR. Uváděné skutečnosti jsou doloženy schématy a grafy. Dokument je dostupný také ve formátu pdf: http://www.ifla.org/VI/5/op/udtop5/udt-op5.pdf.

12. OARD, Douglas W.
Serving Users in Many Languages : Cross-language Information Retrieval for Digital Libraries. D-Lib Magazine [online]. December 1997, vol.3, issue 12.
URL: http://www.dlib.org/dlib/december97/oard/12oard.html

    Článek se zabývá problematikou jazykových bariér při vyhledávání informací a způsobem jejich řešení. Identifikuje jednotlivé problémy, které je třeba řešit technickými protředky, udává příklady uživatelských požadavků a ve světovém rozsahu shrnuje projekty, které se na "mezijazykové" vyhledávání soustřeďují.

13. POLLITT, Steven; SMITH, Martin P.; BRAEKEVELT, Patric A. J.
View-Based Searching Systems - a New Paradigm for Information Retrieval Based on Faceted Classification and Indexing Using Mutualy Constraining Knowledge-Based Views [online]. Huddersfield, UK : University of Huddersfield, CeDAR - Centre for Database Access Research, [1996].
URL: http://www.hud.ac.uk/schools/cedar/bcshci.htm

    Článek poukazuje na absenci dostatečných nástrojů klíčování dokumentů v prostředí WWW. Řešení problému s formulací dotazu, hustotou indexace a odpovídající terminologií vidí v hierarchii předmětových deskriptorů z tezauru a seskupení hodnot atributů. Pro tyto účely prezentuje prototyp rozhraní HIBROWSE, založený na "view-based" technice vyhledávání.

14. RIJSBERGEN, C. J. van
Information Retrieval [online]. 1979.
URL: http://www.dcs.gla.ac.uk/Keith/Preface.html

    Tato kniha je sice již staršího data, v přehledu ji uvádím zejména proto, že je i v pozdějších pracech neustále citována. Popisuje jednotlivé techniky a metody IR, druhé vydání je navíc doplněno o samostatnou kapitolu, věnovanou pravděpodobnostnímu vyhledávání informací.

15. ROBERTSON, S.E.; SPARCK JONES,K.
Simple, proven approaches to text retrieval [online]. Cambridge (GB) : Computer Laboratory, University of Cambridge 1994, updated May 1997. Available Technical Reports.
URL: http://www.ftp.cl.cam.ac.uk/ftp/papers/reports/tr356-ksj-approaches-to-text-retrieval.html

    Autoři této technické zprávy působí na City University, resp. na University of Cambridge. Zpráva popisuje odzkoušené a zavedené přímé techniky indexování a vyhledávání textových dokumentů, princip vážení indexačních termínů a princip interaktivního hledání, tedy zpětné vazby.

16. ROLAND, Perry
XML4MIR: Extensible Markup Language for Music Information Retrieval [online]. Plymouth (MA) : International Symposium on Music Information Retrieval (Music IR 2000), October 23 -25, 2000 [cit. 2001-06-29].
URL: http://ciir.cs.umass.edu/music2000/papers/roland_paper.pdf

Autor v příspěvku hodnotí roli standartů při výměně informací a navrhuje v něm přijetí standardu XML pro znázornění hudby a metadat jako základu vyhledávání informací v oblasti hudby (Music Information Retrieval - MIR).

17. SONG, Fei; CROFT, W. Bruce
A General Language Model for Information Retrieval [online]. Amherst (MA) : Center for Intelligent Information Retrieval, Computer Science Department, University of Massachusetts [1999] [cit. 2001-06-29].
URL: http://ciir.cs.umass.edu/pubfiles/ir-171.pdf

V tomto konferenčním materiálu je prezentován nový jazykový model pro vyhledávání informací, který je založen na řadě technik "urovnávajících" data. Předkládaný model je svým pojetím jednoduchý a intuitivní a může být jednoduše rozřířen tak, aby umožňoval víceslovné vyhledávání.

18. SONNENBERGER, Gabriele
Exploiting the Functionality of Object-Oriented Database Management Systems for Information Retrieval. Data Engineering Bulletin [online]. 1996, vol. 19, no. 1.
URL: ftp://ftp.research.microsoft.com/pub/debull/96MAR-CD.pdf

    Na strankách 16-22 tohoto dokumentu (el.časopisu) se prezentuje přístup použití objektově orientovaných databází (OODBMS) pro účely vyhledávání informací (IR - Information Retrieval). V první části najdeme obsáhlý přehled předchozích pokusů užití DBMS k implemetaci IR systémů. Dále pak rozdíly mezi DBMS a IR systémy s ohledem na indexaci a vyhledávání. Nakonec detailní přehled FIRE, což je znovu použitelný IR framework. Speciální pozornost je věnována návrhu a implementaci IR-indexů a efektivitě vyhledávání s využitím vlastností objektově orientovaných databazových systémů.

19. STEINLE, Stefan
Advanced Information Retrieval Methods [online]. Karlsruhe : Institut für Angewandte Informatik und Formale Beschreibungsverfahren , Universitaet Karlsruhe 1998.
URL:http://www.uni-karlsruhe.de/~uo3f/seminarir/SeminarWeb.html

    Jde o seminární práci k předmětu "Informationsmodellierung in Web-basierten Anwendungssystemen" prezentovanou na Ústavu aplikované informatiky na univerzitě v Karlsruhe (práce je v němčině). Práce se zabývá vektorovým modelem vyhledávání informací, clusterováním, pravděpodobnostními modely, rozšířeným Booleovským modelem a integrovaným zpracováním dat a textu, a to na matematické úrovni. Výklad je doplněn vzorci, příklady výpočtů a schématy. Práce vznikla pod vedením Dr. Dietera Fensela.

20. WARD, Nigel; WOOD, Andrew; FINNIGAN, Sonya aj.
Networked Information Retrieval Standards : Discussion Paper [online]. Queensland, Australia : RDU Reports, c1996 .
URL: http://archive.dstc.edu.au/RDU/reports/webir.html

    V tomto dokumentu jsou popsány technické požadavky pro information retrieval v prostředí Internetu. Jsou tam také diskutovány sociální východiska, která musí být splněna aby byl standard co nejobecněji adoptovatelný.

21. WILEY, Deborah Lynne
Beyond Information Retrieval: Ways to Provide Content in Context. Database [online]. 1996, vol.21, no.4.
URL: http://www.onlineinc.com/database/DB1998/wiley8.html

    Tento dokument byl vytvořen z příspěvku na konferenci "Infonortics' 1998 Search Engines" v Bostonu. Popisuje a vysvětluje rozdíly, výhody a jiné pohledy mezi tradičními a novými metodami a postupy v oboru vyhledávání informací - information retrieval.

Zpět do Digitální knihovny


© Jana Kábrtová, Ondřej Pečený 1998-2001
Původní zdroj rešerše http://www.cuni.cz/~kabrtova/dk/dk.htmIkona znamená nový záznamoproti původnímu zdroji
Zpracováno: 27.5.1998
Aktualizováno: 29.6.2001