Opracowana w Polsce technologia rafinacji informacji pozwala przewidzieć wyniki wyborów Wyróżniony

Opracowana w Polsce technologia rafinacji informacji pozwala przewidzieć wyniki wyborów fot. Pexels.com

Już niemal 4 mld ludzi korzysta obecnie z Internetu na całym świecie.

Codziennie wysyłanych jest ponad 172 mld e-maili czy prawie 500 mln tweetów.

Informacje zawarte w Internecie są kopalnią wiedzy o użytkownikach, co może być wykorzystywane np. przez firmy reklamowe, ale również do prognozowania społecznych czy gospodarczych trendów. Zaawansowaną analizą danych zajmują się polscy naukowcy z nowo otwartego Centrum Rafinacji Informacji.

– Centrum Rafinacji Informacji zajmuje się dostarczaniem informacji z przestrzeni informacyjnej, która jest odpowiednio obrobiona oraz spreparowana, przygotowana pod kątem użytkownika i jego potrzeb. Ktoś może powiedzieć, że każdy ma „dostęp” do informacji. Natomiast problemem jest dostęp do właściwej informacji i właściwe jej zinterpretowanie. Bez narzędzi informatycznych i technologii informacyjnych, dostęp do tych informacji i ich obrabianie jest bardzo utrudnione

– mówi w rozmowie z agencją informacyjną Newseria Innowacje dr hab. inż. Wiesław Cetera z Centrum Rafinacji Informacji.

Rafinacja informacji to technologia wyszukiwania i analizowania w czasie rzeczywistym dużych zbiorów tekstowych. W Centrum Rafinacji Informacji dostępne w sieci informacje będą poddawane zaawansowanej analizie, co pozwoli nie tylko na historyczną ocenę tego, co się wydarzyło, ale ma także umożliwić przygotowanie prognoz dotyczących procesów społecznych, politycznych i gospodarczych. Analizowane są informacje z portali społecznościowych, forów dyskusyjnych oraz wszelkich innych otwartych źródeł zawierających dane ustrukturyzowane, ale także nieustrukturyzowane – bardzo trudne do analizy przy wykorzystaniu tradycyjnych metod i technologii analitycznych.

– Jeśli mówimy o dużych zbiorach, mówimy przede wszystkim o zbiorach nieustrukturyzowanych, tzn. takich, które w przeciwieństwie do zbiorów bazodanowych nie mają jasno określonej struktury, wyróżnionych pól w rekordach itd. Jedyną rzeczą, którą możemy wyróżnić jest np. data, może źródło, a poza tym są to zbiory tekstowe. Czyli przetwarzamy teksty i szukamy tego, co nas w konkretnym zadaniu interesuje – mówi Wiesław Cetera.

W początkowej fazie każdego projektu roboty pobierają informacje z otwartych źródeł. Zebrane w ten sposób dane są oczyszczane (rafinowane) i przeszukiwane pod kątem kluczowych słów oraz powiązań (sentymentów) z wydźwiękiem pozytywnym lub negatywnym. W momencie identyfikacji jakiegoś trendu, naukowcy przechodzą do kolejnego etapu – prognozowania przy wykorzystaniu danych historycznych.

Zespół naukowców CRI prowadzi obecnie zaawansowane analizy dotyczące trendów technologicznych i procesów o największym potencjale innowacyjności na zlecenie Narodowego Centrum Badań i Rozwoju. Centrum dostarcza prognozy dotyczące rozwoju konkretnych technologii, co ułatwia podejmowanie strategicznych decyzji o inwestowaniu środków publicznych.

– Narzędzia, które zostały opracowane, mogą być wykorzystywane do zwykłych badań medioznawczych, które prowadzą różnego rodzaju agencje badań społecznych. Porównując to w aspekcie kosztów, to jest w zasadzie bez porównania, bo my wyniki możemy mieć natychmiast, a co za tym idzie również dużo taniej – twierdzi Wiesław Cetera.

Potencjał tkwiący w Big Data dostrzegły także władze Wrocławia. Agencja Audience Network przygotowując kampanię reklamową miasta do konkursu European Best Destination 2018, wykorzystała narzędzia do profilowania użytkowników Internetu, by w ten sposób dotrzeć do polskich emigrantów. Dzięki zastosowaniu narzędzi do analizy Big Data udało się dotrzeć do blisko 30 tys. użytkowników. Wrocław przegonił w konkursie takie miasta jak Amsterdam, Barcelona czy Paryż, zdobywając 67 proc. wszystkich głosów.

– U zarania wykorzystania rafinacji informacji stały badania prof. Gogołka, który prowadził je w kontekście wyborów prezydenckich. Wyniki, które wtedy otrzymał były bardzo bliskie, jak nie identyczne z tymi, które były w rzeczywistości – przekonuje ekspert.

Analitycy Research Cosmos szacują, że wartość narzędzi analitycznych Big Data ma sięgnąć 9 mld dol. w 2023 roku, przy średniorocznym tempie wzrostu na poziomie 21,15 proc.

Z danych Internet Live Stats wynika, że obecnie z Internetu korzysta już niemal 4 mld ludzi. Codziennie wysyłanych jest niemal 175 mld e-maili i 500 mln tweetów, a ponad 4,5 mld filmów trafia każdego dnia na YouTube.

Powrót na górę

Mapa strony

Biznesciti.com

O biznesie

Przydatne linki

O nas

Polityka Prywatności

W celu realizacji obowiązku informacyjnego, zgodnie z art. 13 Rozporządzenia Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. poniżej przekazujemy „klauzulę informacyjną” z prośbą o zapoznanie się.


Polityka prywatności i przetwarzania danych osobowych

Administratorem Twoich danych osobowych jest Impresja Studio Promocji z siedzibą w Warszawie, przy ulicy Drewnianej 5 lok. 3,. Poniżej znajdziesz wszelkie niezbędne informacje dotyczące przetwarzania Twoich danych osobowych w związku z realizacją usługi informacyjnej.

2. Przedstawicielem Administratora jest Tomasz Brzozowski: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.

3. Dane osobowe przetwarzane są w celu w celu świadczenia usług informacyjnych oraz w celach marketingowych. Podstawą prawną jest art. 6 ust. 1 lit a Rozporządzenia Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. w sprawie ochrony osób fizycznych w związku z przetwarzaniem danych osobowych i w sprawie swobodnego przepływu takich danych oraz uchylenia dyrektywy 95/46/WE - „RODO”).

4. Dane będą przetwarzane w celach marketingowych do momentu wycofania przez Ciebie zgody na takie przetwarzanie.

W zakresie usług Impresja Studio PR Twoje dane będą przetwarzane przez okres, w którym usługi te będą świadczone oraz, w uzasadnionych wypadkach, po zakończeniu ich świadczenia, jednak wyłącznie jeżeli jest dozwolone lub wymagane w świetle obowiązującego prawa np. przetwarzanie w celach statystycznych, rozliczeniowych lub w celu dochodzenia roszczeń. W takim przypadku dane będą przetwarzane jedynie przez okres niezbędny do realizacji odpowiednich celów.

5. Po zakończeniu przetwarzania danych osobowych w pierwotnym celu, dane będą, w uzasadnionych wypadkach, przetwarzane po zakończeniu ich świadczenia, jednak wyłącznie jeżeli jest dozwolone lub wymagane w świetle obowiązującego prawa np. przetwarzanie w celach statystycznych, rozliczeniowych lub w celu dochodzenia roszczeń. W takim przypadku dane będą przetwarzane jedynie przez okres niezbędny do realizacji odpowiednich celów.

6. Podanie danych jest dobrowolne

7. Twoje dane osobowe nie będą przekazywane.

8. Jako administrator Twoich danych, zapewniamy Ci prawo dostępu do Twoich danych, możesz je również sprostować, żądać ich usunięcia lub ograniczenia ich przetwarzania. Możesz także skorzystać z uprawnienia do złożenia wobec Administratora sprzeciwu wobec przetwarzania Twoich danych oraz prawa do przenoszenia danych do innego administratora danych. W przypadku wyrażenia dobrowolnej zgody, przysługuje Ci prawo cofnięcia zgody na przetwarzanie danych w dowolnym momencie co nie wpływa na zgodność z prawem przetwarzania, którego dokonano na podstawie zgody przed jej cofnięciem. Informujemy także, że przysługuje Ci prawo wniesienia skargi do organu nadzorującego przestrzeganie przepisów ochrony danych osobowych.

9. Na niniejszej witrynie znajdują się wtyczki społecznościowe serwisu Facebook: „Lubię to”, które są powiązane z serwisem Facebook. Pod naszym artykułami umieszczany jest kod odwołujący się do serwisu Facebook. Używając przycisku „Lubię to”, użytkownik loguje się do serwisu Facebook, w którym obowiązują zasady ochrony prywatności określone przez serwis Facebook.

10. Ta strona zbiera w sposób automatyczny informacje zawarte w plikach cookies i wykorzystuje je w celach statystycznych oraz do usprawnienia funkcjonowania serwisu. Pliki Cookiem są też zbierane przez Google Analytics. Pliki cookies są plikami tekstowymi, które przechowywane są w komputerze użytkownika serwisu.

Wykorzystujemy dwa rodzaje plików cookies – tymczasowe i stałe. Pliki tymczasowe przechowywane są do momentu opuszczenia przez Ciebie naszej strony (poprzez wejście na inną stronę, wylogowanie lub wyłączenie przeglądarki). Pliki stałe przechowywane są w Twoim komputerze do czasu ich usunięcia lub przez czas wynikający z ich ustawień.

W każdej chwili możesz dokonać zmiany ustawień swojej przeglądarki, aby zablokować obsługę plików cookies lub każdorazowo uzyskiwać informacje o ich umieszczeniu w swoim urządzeniu. Inne dostępne opcje możesz sprawdzić w ustawieniach swojej przeglądarki internetowej. Większość przeglądarek domyślnie jest ustawione na akceptację zapisu plików cookies w komputerze. Informacje dotyczące ustawień przeglądarek internetowych dostępne są w jej menu (pomoc) lub na stronie jej producenta.

Korzystając z tej strony wyrażasz zgodę na wykorzystywanie cookies zgodnie z ustawieniami Twojej przeglądarki.