Informationstandard.pl - wspomaganie decyzji - link do strony głównej
wyszukiwanie:
Podziel się opinią o serwisie

WDROŻENIA

Migracja po dwóch dekadach

Bank BGŻ wymienia - zainstalowany jeszcze w latach 90. - system BankStreet. Nowa aplikacja - Flexcube - wspomaga działania centrali.

Efekt gwarantowany

Narzędzia analityczne wydatnie poprawiają skuteczność bankowych kampanii marketingowych.

ANALIZY

Czwarta fala

Rodzaj medium będącego zarówno nośnikiem, jak i sposobem przekazywania informacji, definiuje cechy organizacji gospodarczych i ma wpływ na zarządzanie przedsiębiorstwami. W epoce multimedialnych sieci zasady powstawania i funkcjonowania tych struktur ulegają zmianie.

Przyszłość to usługi i aplikacje

W obecnych warunkach ekonomicznych użytkownicy IT oczekują przede wszystkim lepiej zintegrowanych rozwiązań oraz bardziej kompleksowej obsługi.

PRODUKTY

Ma działać bez przerwy

Niektóre usługi biznesowe muszą być świadczone w trybie ciągłym, z możliwie niskim prawdopodobieństwem nieplanowanych przerw. Aby systemy IT mogły świadczyć usługi na żądanym poziomie niezawodności, muszą być do tego odpowiednio przystosowane.

Maszyna dla danych

Sun Oracle Database Machine v2 został oparty na sprzęcie Suna. Pierwsza wersja, która powstała jeszcze przed ogłoszeniem planów fuzji Oracle-Sun, była oparta na technologii HP.

popularne

Najczęściej czytane

WYWIADY

EN FACE: Sebastian Ryszard Kruk...

... pracownik naukowy Digital Enterprise Research Institute na Narodowym Uniwersytecie Irlandzkim i wykładowca na Politechnice Gdańskiej, autor pracy doktorskiej na temat semantycznych bibliotek cyfrowych, twórca start-upu Knowledge Hives i Szkoły Web 3.0.

Coraz więcej inteligencji

Rozmowa z Nickiem Pachnosem, szefem działu rozwiązań na platformę mainframe w BMC Software.

Luksusowa analiza

Stephen Brobst, Chief Technology Officer w Teradata, rozmawiał z nami na temat rynku business intelligence.

powiększ tekst >
ARCHIWUM

Od informacji do oferty

27 października 2009

(ag),
Bogactwo zasobów internetowych kojarzy się nam zazwyczaj z ogromem informacji dostępnych w sieci. Tymczasem odpowiednio wyselekcjonowane informacje mogą być tylko wstępem do znacznie głębszych zasobów wiedzy.


ComputerworldW książce "Eksploracja zasobów internetowych" dosyć szczegółowo i dogłębnie omówione zostały metody i sposoby przekształcania informacji pozyskanych z Internetu w użyteczną dla wielu działań i decyzji wiedzę. Jest to już trzecia publikacja z serii poświęconej eksploracji danych. Wcześniej ukazały się dwie prace Daniela Larose'a: Odkrywanie wiedzy z danych oraz Metody i modele eksploracji danych.

Autorzy zaczynają od omówienia podstawowych idei i technik wydobywania informacji tekstowej z sieci. Opisują sposoby zbierania i indeksowania dokumentów sieciowych oraz tworzenia rankingów stron internetowych według kryterium zawartości tekstowej i struktury hiperpołączeń. Piszą o powszechnie znanych metodach indeksowania i wyszukiwania informacji według słów kluczowych, jak również o bardziej zaawansowanych metodach, takich jak model przestrzeni wektorowej, szeregowanie dokumentów czy metody relevance feedback.

To wszystko stanowi jednak tylko wstęp, etap przygotowawczy do procesu analizy struktury i zawartości sieci WWW. Bardzo przydatne w tym zakresie okazują się być metody uczenia maszynowego i eksploracji danych. To one pozwalają porządkować zasoby sieciowe, doszukiwać się w nich pewnych wzorów czy stałych relacji, a nie tylko traktować je jako źródło dostępu do wyizolowanych informacji.

Dzięki tym metodom możliwa jest z kolei analiza użytkowania sieci. Według autorów, jest ona "stosowaniem metod eksploracji danych, w celu odkrycia wzorców korzystania z sieci, po to, by zrozumieć i lepiej zaspokoić potrzeby użytkowników programów sieciowych". Inaczej mówiąc, odtwarza ona zachowania użytkowników podczas korzystania z Internetu. Ze zrozumiałych względów cieszy się szczególnym zainteresowaniem specjalistów od handlu, marketingu i reklamy. Bazując na jej wynikach, mogą oni sprawować swoistą kontrolę nad działaniami internautów, oferując im na przykład w odpowiednim momencie odpowiednie produkty, wyselekcjonowane przy użyciu algorytmów grupowania lub metod asocjacyjnych.

Autorzy szczegółowo piszą o tym, jak korzystać z danych dostępnych w sieci, by uzyskać po ich przetworzeniu jak najbardziej przydatną wiedzę. Wiele miejsca poświęcają na przykład czyszczeniu danych i filtrowaniu danych oraz zapewnieniu ich właściwej jakości. Piszą o metodach modelowania zachowań użytkowników Internetu, stosowanych do tego celu metodach grupowania, regułach asocjacyjnych, algorytmach apriori, drzewach klasyfikacyjnych i regresyjnych. Zajmują się też bardziej znanymi metodami, jak na przykład metoda identyfikacji użytkownika za pomocą plików cookies. Nie po to jednak, by omawiać szczegółowo zasady ich działania, lecz by wskazać, jak sobie poradzić, gdy użytkownik je zablokował lub skasował. (AG)

Zdravko Markov, Daniel T. Larose: Eksploracja zasobów internetowych. Analiza struktury, zawartości i użytkowania sieci WWW; Wydawnictwo Naukowe PWN, Warszawa 2009
Wystaw ocenę:
   Średnia ocena (liczba głosów: 0)
wydrukuj wydrukuj wyslij do znajomegowyślij do znajomego

Komentarze

Ten artykuł nie ma jeszcze żadnych komentarzy. Twój może być pierwszy...