News

01.09.2010

InfexBA in der lokalen Presse

Unter dem Titel "Die Zukunft von Märkten vorhersagen – s-lab entwickelt automatische Markt-, Trend- und Stimmungsanalyse für Unternehmen" wird in der August-Ausgabe der elektronischen Universitätszeitschrift Forschung InSight über die Arbeit am Projekt InfexBA auf Seiten der Uni Paderborn berichtet.

Link zum Artikel: Artikel

 
 

20.08.2010

Firefox Add-on "RevMarker BA" veröffentlicht

Seit heute steht die erste Version des frei verfügbaren InfexBA Add-ons "RevMarker BA" für Mozilla Firefox unter Ergebnisse zum Download bereit.

Dieses Add-on integriert die InfexBA-Marktanalyse in den weit verbreiteten Open-Source-Browser Mozilla Firefox. Wahlweise automatisch oder per Knopfdruck wird die aktuell geöffnete Webseite in unten angegebenen Webservice analysiert, um Aussagen über die Umsätze von Firmen und Märkten zu identifizieren. Diese Aussagen werden direkt im Browser gehighlighted.

 
 

21.06.2010

Musik- und Smartphone-Korpus jetzt verfügbar

Ein annotierter Textkorpus mit Dokumenten aus dem Musik- und Smartphone-Bereich, der der Entwicklung und Evaluierung von Klassifikationsverfahren für Genre- und Stimmungsanalyse dient, ist unter Ergebnisse erhältlich.

Auch der Umsazukorpus befindet sich jetzt auf dieser Seite. Alle weiteren Informationen dazu dort.

Neben den Korpora beinhaltet die Seite Ergebnisse auch einen Überblick über Publikationen im Umfeld des Projekts. In Kürze werden Download-Möglichkeiten für frei verfügbare Software folgen.

 
 

14.06.2010

Paper aus dem InfexBA-Umfeld auf der COLING 2010 in Peking

Im Umfeld des InfexBA-Projekts ist die Veröffentlichung "Efficient Statement Identification for Automatic Market Forecasting" entstanden. Das Paper wurde bei der weltgrößten Computerlinguistik-Konferenz COLING, die alle zwei Jahre und dieses Jahr vom 23.8. bis 27.8. in Peking stattfindet, angenommen.

Das Paper stellt einerseits der Gesamtprozess der auf Verfahren der Information Extraction basierenden Marktanalyse vor und zeigt Ergebnisse der Evaluierung der Identifizierung von Umsatzaussagen. Andererseits wird der von Resolto annotierte Umsatzkorpus präsentiert und damit der Wissenschaft zugänglich gemacht.

Geschrieben wurde das Paper von Henning Wachsmuth, Peter Prettenhofer und Benno Stein

 
 

22.02.2010

Umsatzkorpus verfügbar

Ein annotierter Textkorpus für die Entwicklung und Evaluierung von Information-Extraction-Verfahren im Bereich der Marktinformationen ist auf der Startseite verfügbar.

Der Korpus enthält 1128 deutschsprachige Online-Newsartikel von insgesamt 29 bekannten Webportalen im XMI-Format (die Quell-URL ist im Text gegeben). In einem beigefügten Split sind 2/3 der Dokumente Trainingsdaten und je 1/6 Validierungs- bzw. Testdaten. 

In jedem Dokument sind alle Sätze, die Aussagen über Firmen- und Marktumsätze beinhalten, als solche gekennzeichnet. Zusätzlich sind die zugehörigen Geld- und Zeitausdrücke wie auch Thema und Verfasser der Aussage annotiert und mit dem entsprechenden Satz verknüpft. Insgesamt sind 2044 Umsatzaussagen auf diese Weise getaggt.

 
 

09.02.2010

Fertigstellung des Korpus zu Stimmungen und Buzz

Die Auswahl und Annotierung der Dokumente des Korpus' für Stimmungen und Buzz as auch deren Annotierung sind in einer ersten Version abgeschlossen.

Der Korpus enthält 2101 deutschsprachige Blog-Einträge zum Thema Smartphone sowie 3407 Profi-Rezensionen und User-Reviews aus dem Musik-Bereich. Pro Text wurde einerseits Genre annotiert; in diesem Fall wird zwischen kommerziellen, informationellen und persönlichen Texten unterschieden. Zum anderen wurde die Polarität der Stimmung – sofern vorhanden – bestimmt, d.h. ob der Text seinem Thema positiv, negativ oder neutral gegenübersteht.

Mit diesem Korpus haben wir eine sehr gute Grundlage, um die gewünschten Verfahren für Trend- und Stimmungsanalyse entwickeln zu können. Die Statistiken in der Abbildung zeigen jedoch noch gewisse Ungleichgewichte, so dass wir ggf. noch an der Zusammensetzung der Dokumentsammlung feilen werden.

 

 
 

28.10.2009

Poster zu InfexBA auf der KI2009

Vom 15. bis 18. September 2009 fand in Paderborn die 32ste jährliche Konferenz zu künstlicher Intelligenz statt, kurz: die KI2009. Das s-lab hat sich auf dieser Konferenz mit zwei Postern vorgestellt, darunter einem über das InfexBA-Projekt.

Etwas verspätet kann nun an dieser Stelle online ein Blick auf das Poster geworfen werden, das die wesentliche Idee, unsere Ansätze, die den Verfahren unterliegenden Prozesse sowie zwei kleine Information Extraction Beispiele zeigt.

 
 

28.10.2009

Webseite in Englisch

Die Webseite lässt sich nun auch in englischer Sprache anzeigen.

 

 

 
 

25.09.2009

Fertigstellung des Korpus zu Bilanzen und Prognosen

Sowohl die Auswahl der Dokumente des Korpus für Bilanzen und Prognosen als auch Annotierung dieser Dokumente sind abgeschlossen. Lediglich die Überprüfung jedes einzelnen Dokuments läuft noch, wird aber in Kürze abgeschlossen werden.

Der Korpus enthält 1128 deutschsprachige Online-News-Artikel aus der Geschäftswelt, in denen insgesamt 2048 Aussagen über die zukünftigen Umsätze (im Sinne von Prognosen) und die vergangenen (i.S.v. Angaben) von Firmen, Branchen und Technologien annotiert sind. Zusätzlich sind pro Aussage das zugehörige Thema und der Verfasser sowie auftretende Geld- und Zeitausdrücke markiert und mit der Annotation der Aussage verknüpft.

Wir sehen in dem Korpus einen ausgezeichneten Ausgangspunkt, um sich mit der Erkennung von Umsatzaussagen mittels IE-Technologien zwecks automatisierter Marktanalyse beschäftigen zu können!

[update 9.2.2010]

 

 
 

10.07.2009

Erstellung eines Named-Entity-Korpus (inklusive Entity Relations) zu Bilanzen und Prognosen

Im Zuge der Kernfunktionalitäten a. und b. wird im InfexBA-Projekt ein Korpus erstellt, der die vergangene und zukünftige Entwicklung der Umsätze von Firmen und Branchen analysierbar machen soll.

Der Korpus wird aus deutschsprachigen News-Artikeln bestehen, in denen Aussagen über entsprechende Umsätze enthalten sind. Neben diesen Angaben und Prognosen selbst werden zu jeder Aussage die zugehörigen Geld- und Zeitinformationen, das behandelte Thema wie auch der Autor als Named Entities annotiert werden.

Mit diesem Korpus schaffen wir eine ausgezeichnete Grundlage, um sich mit Verfahren der Information Extraction in wirtschaftlichen Zusammenhängen beschäftigen zu können.

 

 
 

09.06.2009

Definition der Kernfunktionalitäten

Die zu erreichenden Kernfunktionalitäten wurden erarbeitet. Sie befassen sich mit der Ermittlung und geeigneten Aufbereitung von Informationen aus fünf Bereichen:

a. Bilanzen: Entwicklung der Umsätze relevanter Branchen.

b. Prognosen: Schätzungen über die zukünftige Entwicklung der Umsätze relevanter Branchen.

c. Stimmungen: Meinungen über die Produkte, Technologien oder Marken relevanter Branchen.

d. Buzz: Aufmerksamkeit, die Produkte, Technologien oder Marken relevanter Branchen in sozialen Medien erregen. 

e. Innovationen: Aufkommen an Patenten bzw. Patentanmeldungen relevanter Technologien oder Branchen.

 

 
 

05.05.2009

Webseite online

Die InfexBA-Webseite ist online.

  

 
 

18.12.2008

Bund fördert Forschungsprojekt zur Informationsgewinnung für Geschäftsanwendungen – s-lab der Universität Paderborn führt Projekt mit zwei Unternehmen und Bauhaus-Uni Weimar

Foto (v. li.): Haben das Projekt gestartet Dennis Hannwacker (Resolto), Prof. Dr. Gregor Engels (s-lab – Universität Paderborn, Koordinator), Tanja Krüger (Resolto), Prof. Dr. Benno Stein (Bauhaus-Universität Weimar), Anna Falkenhain (Resolto), Dr. Theodor Lettmann (Universität Paderborn), Thorsten Mann (Digital Collections), Stefan Sauer (s-lab – Universität Paderborn, Projektmanager).

750.000 Euro Projektvolumen – 550.000 Euro Förderung vom Bundesministerium für Bildung und Forschung

Jeder Internet-Nutzer kennt es: Das schnelle Finden der richtigen Informationen im Internet ist eine schwierige Aufgabe. Inzwischen gibt es zahlreiche Ansätze, privaten Benutzern die Suche nach Informationen zu erleichtern. „Das professionelle Erschließen von Informationsquellen im World Wide Web auch für geschäftliche Anwendungen und das verteilte Management von Wissen sind noch unterentwickelt, spielen aber für Unternehmen eine immer wichtigere Rolle“, so Stefan Sauer, Geschäftsführer des Software Quality Lab (s-lab) der Universität Paderborn.

Das s-lab hat gemeinsam mit drei Partnern ein nationales Forschungsprojekt gewonnen, das für dieses Problem Lösungen entwickeln soll. Das Bundesministerium für Bildung und Forschung fördert das Vorhaben mit 550.000 Euro und 200.000 Euro steuern die beteiligten Unternehmen bei.

Gemeinsam mit Prof. Dr. Benno Stein von der Bauhaus-Universität Weimar, einem international anerkannten Experten im Bereich der intelligenten Informationsverarbeitung, und seinen Mitarbeitern erforschen die Paderborner Informatiker Techniken der Informationsgewinnung für Trend-, Stimmungs- und Marktanalysen. „Diese Techniken helfen Unternehmen beim Erschließen von Expertenwissen, beim Erkennen von Technologietrends, bei der Suche nach Geschäftspartnern oder Mitbewerbern oder bei der Erstellung von Marktberichten“, skizziert Prof. Dr. Gregor Engels, verantwortlicher Leiter des Projekts im s-lab, den Nutzen der Projektergebnisse für die Wirtschaft. „Wir entwickeln intelligente Verfahren für die Suche nach Wissen in großen Datenmengen. Diese Verfahren sollen als Software-Bibliothek für vielfältige Anwendungen zur Verfügung stehen“, sagt Dr. Theodor Lettmann, Paderborner Wissenschaftler, der seit vielen Jahren zusammen mit Benno Stein auf dem Gebiet der intelligenten Informationsverarbeitung forscht.

Für die praktische Anwendung der Forschungsergebnisse sind zwei mittelständische Unternehmen mit im Boot: Digital Collections Verlagsgesellschaft aus Hamburg und Resolto Informatik aus Herford. Sie werden Anwendungsfälle und reale Testdatensätze entwickeln und die Verfahren in praktischen Anwendungen für die Medienbranche und den Maschinenbau evaluieren.

Das Projekt wird im Rahmen des Förderprogramms „KMU-innovativ: IKT“ gefördert, das Teil der Hightech-Strategie des Bundes ist. Ziel des Programms ist die Förderung von Spitzenforschung für den Mittelstand im Bereich Informations- und Kommunikationstechnologie (IKT). In drei Auswahlrunden wurden aus rund 500 Einreichungen bisher 75 Vorhaben zur Förderung ausgewählt. „Wir freuen uns, dass unser Projektantrag das Begutachtungsverfahren erfolgreich durchlaufen hat und zu den Gewinnern des Wettbewerbs gehört“, sagt Stefan Sauer. Er ist überzeugt: „Die bisherigen Forschungsergebnisse und Fähigkeiten der beteiligten Partner bilden eine ausgezeichnete Basis, sich dieser Herausforderung zu stellen.“

Impressum | Webmaster | Letzte Änderungen am : 30.11.2010