M.184.5331 Applied Machine Learning for Text Analysis | |
---|---|
(Applied Machine Learning for Text Analysis) |
Koordinator (coordinator): | Prof. Dr. Oliver Müller |
Ansprechpartner (contact): | Prof. Dr. Oliver Müller (oliver.mueller[at]uni-paderborn.de) |
Credits: | 10 ECTS |
Workload: | 300 Std (h) |
Semesterturnus (semester cycle): | WS |
Studiensemester (study semester): | 1-4 |
Dauer in Semestern (duration in semesters): | 1 |
Lehrveranstaltungen (courses): | ||||||
---|---|---|---|---|---|---|
Nummer / Name (number / title) |
Art (type) |
Kontaktzeit (contact time) |
Selbststudium (self-study) |
Status (P/WP) (status) |
Gruppengröße (group size) | |
a) | K.184.53311 / Applied Machine Learning for Text Analysis | Seminar | P | |||
Wahlmöglichkeiten innerhalb des Moduls (Options within the module): | ||||||
Keine |
Empfohlene Voraussetzungen (prerequisites): |
---|
Solide Kenntnisse in den
Bereichen Machine Learning und Programmierung (Python) |
Inhalte (short description): |
---|
Schätzungen zufolge sind heutzutage etwa 80% aller Daten unstrukturiert. Im Gegensatz zu strukturierten Daten, die wohlstrukturiert und inhaltlich meist numerisch sind, sind unstrukturierte Daten oft textuell und daher schwieriger zu interpretieren. Die Aufgabe, Wissen aus Textdokumenten zu extrahieren, bekannt als Textanalyse oder natürliches Sprachverständnis, ist äußerst komplex und immer noch begrenzt durch die Möglichkeiten von Computern, die Feinheiten menschlicher Sprachen zu verstehen.
In diesem Hands-on-Seminar werden die Studierenden in den aktuellen Stand des maschinellen Lernens und die Techniken der Verarbeitung natürlicher Sprache eingeführt (z.B. Textklassifikation, Themenmodellierung, künstliche neuronale Netze, Worteinbettungen). Durch Programmierübungen (Python) können die Studierenden nicht nur ihr theoretisches Wissen über verschiedene Algorithmen vertiefen, sondern haben auch die Möglichkeit, diese Methoden auf reale Probleme anzuwenden. Die Veranstaltungen finden regelmäßig in der Vorlesungazeit statt, das Modul schließt mit der Abgabe der Hausarbeit und nachfolgender Präsentation nach der Vorlesungszeit. It is estimated that approximately 80% of all existing data is unstructured. Unlike structured data, which is usually well-structured and mostly numerical, unstructured data is often textual and therefore far more difficult to interpret. The task of extracting knowledge from text documents, known as text analysis or natural language understanding, is extremely complex and still limited by the ability of computers to understand the subtleties of human languages. In this hands-on seminar, students will be introduced to the current state of machine learning and natural language processing techniques (e.g. text classification, topic modelling, artificial neural networks, word embeddings). With programming exercises (Python), students deepen their theoretical knowledge of different algorithms and get the opportunity to apply these methods to real-world issues. Lectures take place regularly during the lecture period, the module ends with the submission of the term paper and subsequent presentation after the lecture period. |
Lernergebnisse (learning outcomes): |
---|
Fachkompetenz Wissen (professional expertise): |
Studierende... Students... |
Fachkompetenz Fertigkeit (practical professional and academic skills): |
Studierende... Students... |
Personale Kompetenz / Sozial (individual competences / social skills): |
Studierende... Students... |
Personale Kompetenz / Selbstständigkeit (individual competences / ability to perform autonomously): |
Studierende... Students... |
Prüfungsleistungen (examinations) | |||
---|---|---|---|
Art der Modulprüfung (type of modul examination): Modulprüfung | |||
Art der Prüfung (type of examination) |
Umfang (extent) |
Gewichtung (weighting) | |
a) | Hausarbeit | 20-30 Seiten/pages [Abgabe i.d.R. am 1. Sonntag im März] | 60.00 % |
b) | Präsentation | 20 Minuten/minutes [Präsentation i.d.R. 10-14 Tage nach Abgabe] | 40.00 % |
Studienleistung / qualifizierte Teilnahme (module participation requirements) |
---|
Nein |
Voraussetzungen für die Teilnahme an Prüfungen (formal requirements for participating in examinations) |
---|
Keine |
Voraussetzungen für die Vergabe von Credits (formal requirements for granting credit points) |
---|
Die Vergabe der Credits erfolgt, wenn die Modulnote mindestens „ausreichend“ ist |
Gewichtung für Gesamtnote (calculation of overall grade) |
---|
Das Modul wird mit der Anzahl seiner Credits gewichtet (Faktor: 1) |
Verwendung des Moduls in den Studiengängen (The module can be selected in the following degree programmes) |
---|
M.Sc. Wirtschaftsinformatik M.Sc. Management Information Systems |
Umfang QT (participation requirements): |
---|
Lernmaterialien, Literaturangaben (learning material, literature): |
---|
Teilnehmerbegrenzung (participant limit): |
---|
20 Personen |
Sonstige Hinweise (additional information): |
---|
BITTE BEACHTEN PLEASE NOTE! |