Ingo Siegert

Jun.-Prof. Dr.-Ing. Ingo Siegert
Institut für Informations- und Kommunikationstechnik (IIKT)
Vitae
since 11/2018 | Assistant Professor for Mobile Dialogsystems at the Institute for Information Technology and Communications University Magdeburg |
04/2015 - 10/2018 | Post-doctoral researcher at the Cognitive Systems Group |
03/2015 | Graduation (Dr.-Ing.) Title of PhD-Thesis: Emotional and User-Specific Cues for Improved Analysis of Naturalistic Interactions Otto-von-Guericke-Universität Magdeburg |
07/2009-03/2015 | Research asistant at the Cognitive Systems Group within the project SFB/TRR 62 |
05/2009 | Diploma in Engineering Sciences title of Diploma thesis: Implementierung einer Sprecherverifikation für ein generisches Telefon-Dialogsystem |
9/2006 - 05/2009 |
Student Assistant at the Cognitive Systems Group |
10/2007 - 03/2008 |
Internship at IBM Deutschland Entwicklung GmbH Department WebSphere VoiceServer Language Development |
10/2003-05/2009 |
Study of information technology at the Otto-von-Guericke-University Magdeburg Beginn des Studiums der Informationstechnologie an der Otto-von-Guericke-Universität Magdeburg |
06/2003 | Acquisition of the general higher education entrance qualification at the Gymnasium Stadtfeld Wernigerode |
Dissertation
Emotional and User-Specific Cues for Improved Analysis of Naturalistic Interactions. Otto-von-Guericke-Universität Magdeburg, 2015
Research Interests
Speech-Processing, Addressee-detection, Dialog-design, Speech-signal processing, Speech coding, Human-Machine-Interaction, Modelling of User's mood or intention, speakergroups and emotions
Memberships
Institute of Electrical and Electronics Engineers (IEEE)
Usability in Germany (UiG)
2023
Begutachteter Zeitschriftenartikel
A digital flat affect? - popular speech compression codecs and their effects on emotional prosody
In: Frontiers in communication - Lausanne: Frontiers Media, Bd. 8 (2023)
Buchbeitrag
Cross-reliability benchmark test for preserving emotional content in speech-synthesis related datasets
In: Elektronische Sprachsignalverarbeitung 2023 - Dresden: TUDpress; Draxler, Christoph . - 2023, S. 64-72 - (Studientexte zur Sprachkommunikation; 105)
Radlogistik als Anwendugsgebiet für Digitale Sprachassistenten - ein Diskussionsbeitrag
In: Elektronische Sprachsignalverarbeitung 2023 - Dresden: TUDpress; Draxler, Christoph . - 2023, S. 223-230 - (Studientexte zur Sprachkommunikation; 105)
2022
Abstract
A preliminary study on voice-assisted interfaces in the German public administration
In: KM Conference 2022 - International Institute for Applied Knowledge Management, 2022 . - 2022, S. 42
Der sprachliche Emotionsausdruck von Patient*innen mit Anorexia nervosa - eine systematische Literaturrecherche
In: Zeitschrift für psychosomatische Medizin und Psychotherapie - Göttingen: Vandenhoeck & Ruprecht, 1999, Bd. 68 (2022), 2, S. 180-181
Artikel in Kongressband
Pseudonymisation of speech data as an alternative approach to GDPR aompliance
In: Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022) - Paris: European Language Resources Association (ELRA); Rigault, Mickaël . - 2022, S. 17-21
Public interactions with voice assistant - discussion of different one-shot solutions to preserve speaker privacy
In: Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022) - Paris: European Language Resources Association (ELRA); Rigault, Mickaël . - 2022, S. 44-47
Begutachteter Zeitschriftenartikel
Acoustic-based automatic addressee detection for technical systems - a review
In: Frontiers in computer science - Lausanne: Frontiers Media, 2019, Bd. 4 (2022), insges. 20 S.
Handling of unknown unknowns - classification of 3D geometries from CAD open set datasets using Convolutional Neural Networks
In: The Online Journal of Applied Knowledge Management - [S.l.]: [s.n.], Bd. 10 (2022), 1, S. 62-76
Künstliche Intelligenz für die Sprachanalyse in der Psychotherapie - Chancen und Risiken - Artificial intelligence for speech analysis in psychotherapy - chances and risks
In: Psychotherapie, Psychosomatik, medizinische Psychologie - Stuttgart [u.a.]: Thieme, Bd. 72 (2022), 9/10, S. 395-396
Buchbeitrag
"High on emotion"? - how audio codecs interfere with the perceived charisma and emotional states of men and women
In: Konferenz: 33. Konferenz \"Elektronische Sprachsignalverarbeitung\", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022/ Konferenz Elektronische Sprachsignalverarbeitung - Dresden: TUDpress; Weston, Heather . - 2022, S. 243-252 - (Studientexte zur Sprachkommunikation; 103)
DyCoDa - a multi-modal data collection of multi-user remote survival game recordings
In: Konferenz: 24th International Conference on Speech and Computer, SPECOM 2022, Gurugram, India, November 14-16, 2022, Speech and Computer - Cham: Springer International Publishing; Prasanna, S. R. Mahadeva . - 2022, S. 163-177 - (Lecture notes in computer science; volume 13721)
Emotion preservation for one-shot speaker anonymization using McAdams
In: Konferenz: 33. Konferenz \"Elektronische Sprachsignalverarbeitung\", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022 - Dresden: TUDpress; Weston, Heather . - 2022, S. 235-242 - (Studientexte zur Sprachkommunikation; 103)
Erroneous reactions of voice assistants "In the Wild" - first analyses
In: Konferenz: 33. Konferenz \"Elektronische Sprachsignalverarbeitung\", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022 - Dresden: TUDpress; Weston, Heather . - 2022, S. 113-120 - (Studientexte zur Sprachkommunikation; 103)
Improving the accuracy for voice-assistant conversations in German by combining different online ASR-API outputs
In: Konferenz: Human Perspectives on Spoken Human-Machine Interaction, Freiburg im Breisgau (online), 15.-17. November 2021, Proceedings of the conference Human Perspectives on Spoken Human-Machine Interaction - Freiburg: FRIAS, Freiburg Institute for Advanced Studies, Albert-Ludwigs-Universität; Warchhold, Sarah *1994-* . - 2022, S. 11-16
Music-guided imagination and digital voice assistant - study design and first results on the application of voice assistants for music-guided stress reduction
In: Konferenz: 24th International Conference on Human-Computer Interaction, HCII 2022, Virtual Event, June 26 July 1, 2022, Design, Operation and Evaluation of Mobile Communications - Cham: Springer International Publishing; Salvendy, Gavriel . - 2022, S. 347-362 - (Lecture notes in computer science; volume 13337)
Performance and quality evaluation of a McAdams speaker anonymization for spontaneous German speech
In: Fortschritte der Akustik - DAGA 2022 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2022, S. 1185-1188
The effect of room acoustics and channel coding on affective computing in far field speech interaction
In: DAGA 2022 - Berlin: Deutsche Gesellschaft für Akustik e.V. . - 2022, S. 74-77
The influence of different room acoustics and microphone distances on charismatic prosodic parameters
In: Fortschritte der Akustik - DAGA 2022 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2022, S. 1193-1196
Voice Privacy - leveraging multi-scale blocks with ECAPA-TDNN SE-Res2NeXt extension for speaker anonymization
In: Symposium: 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022, Incheon, Korea, 23-24 September 2022, 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022 - Internatinal Speech Communication Association; Siegert, Ingo . - 2022, S. 43-48
Why Eli Roth should not use TTS-Systems for anonymization
In: Symposium: 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022, Incheon, Korea, 23-24 September 2022, 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022 - Internatinal Speech Communication Association; Siegert, Ingo . - 2022, S. 17-22
Herausgeberschaft
2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022
In: Internatinal Speech Communication Association, 2022, 1 Online-Ressource
Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022)
In: Paris: European Language Resources Association (ELRA), 2022, 1 Online-Ressource
2021
Artikel in Kongressband
Experience with an online assessment in a lecture about fundamentals of electrical engineering
In: Higher Education 2021 - Bari: Higher Education . - 2021, insges. 5 S.
How to collect speech data with human rights in mind - workshop at the SPSC
In: Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication - Internatinal Speech Communication Association; Siegert, Ingo . - 2021, S. 80-82
Speaker anonymization solution for public voice-assistant interactions - presentation of a work in progress development
In: Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication - Internatinal Speech Communication Association . - 2021, S. 80-82
Begutachteter Zeitschriftenartikel
A cross-language study of speech recognition systems for English, German, and Hebrew
In: The Online Journal of Applied Knowledge Management - [S.l.]: [s.n.], Bd. 9 (2021), 1, insges. 15 S.
Admitting the addressee detection faultiness of voice assistants to improve the activation performance using a continuous learning framework
In: Cognitive systems research - Amsterdam [u.a.]: Elsevier Science, Bd. 70 (2021), S. 65-79
Case report: women, be aware that your vocal charisma can dwindle in remote meetings
In: Frontiers in communication - Lausanne: Frontiers Media, Volume 5(2021), article 611555, 7 Seiten
Buchbeitrag
Audio and video processing of UAV-based signals - the harmonic project
In: Elektronische Sprachsignalverarbeitung 2021: Tagungsband der 32. Konferenz Berlin, 4.-5. März 2021/ Möller, Sebastian - Dresden: TUDpress; Hillmann, Stefan . - 2021, S. 77-86
Effects of prosodic variations on accidental triggers of a commercial voice assistant
In: Interspeech 2021: Brno, Czechia, 30 August - 3 September 2021$dGeneral chairs: Hynek Heřmanský, Honza Černocký : Technical chairs: Lukáš Burget, Lori Lamel, Odette Scharenborg, Petr Motlicek - International Speech and Communication Association; Heřmanský, Hynek . - 2021, S. 1674-1678
Engagement recognition using audio channel only
In: 1st AI-DEbate Workshop: workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021/ AI-Debate Workshop - Magdeburg: Universitätsbibliothek; Carolus, Astrid *1982-* . - 2021, S. 19-22
Introduction to the workshop
In: 1st AI-DEbate Workshop: workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021/ AI-Debate Workshop - Magdeburg: Universitätsbibliothek; Carolus, Astrid *1982-* . - 2021, S. 9-11
Speech melody and speech content didnt fit together - differences in speech behavior for device directed and human directed interactions
In: Advances in Data Science: Methodologies and Applications - Cham: Springer International Publishing; Phillips-Wren, Gloria . - 2021, S. 65-95 - (Intelligent Systems Reference Library; volume 189)
Speech signal compression deteriorates acoustic cues to perceived speaker charisma
In: Elektronische Sprachsignalverarbeitung 2021: Tagungsband der 32. Konferenz Berlin, 4.-5. März 2021/ Möller, Sebastian - Dresden: TUDpress; Hillmann, Stefan . - 2021, S. 1-10
Studie zur Lösbarkeit des Problems starker Pegelschwankungen im Home-Entertainment
In: Elektronische Sprachsignalverarbeitung 2021: Tagungsband der 32. Konferenz Berlin, 4.-5. März 2021/ Möller, Sebastian - Dresden: TUDpress; Hillmann, Stefan . - 2021, S. 303-310
Herausgeberschaft
1st AI-DEbate Workshop - workshop establishing An InterDisciplinary pErspective on speech-BAsed TEchnology : Magdeburg, September, 27 2021
In: Magdeburg: Universitätsbibliothek, 2021, 1 Online-Ressource (42 Seiten, 1,03 MB)
Proceedings 2021 ISCA Symposium on Security and Privacy in Speech Communication
In: Internatinal Speech Communication Association, 2021, 1 Online-Ressource (88 Seiten)
2020
Abstract
Intelligent LSF-answering system - an Alexa Skill
In: Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]: Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]/ Workshop Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook] - Anwendungen, Implikationen, Entwicklungen - Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020; Siegert, Ingo . - 2020, S. 39
das ist schon gruselig so dieses Belauschtwerden - subjektives Erleben von Interaktionen mit Sprachassistenzsystemen zum Zwecke der Individualisierung
In: Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]/ Workshop Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook] - Anwendungen, Implikationen, Entwicklungen - Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020; Siegert, Ingo . - 2020, S. 29
Begutachteter Zeitschriftenartikel
Personal data protection and academia: GDPR issues and multi-modal data-collections "in the wild"
In: The Online Journal of Applied Knowledge Management: OJAKM - [S.l.], Bd. 8 (2020), 1, S. 16-31
Using complexity-identical human- and machine-directed utterances to investigate addressee detection for spoken dialogue systems
In: Sensors - Basel: MDPI, Volume 20(2020), issue 9, article 2740, 15 Seiten
Buchbeitrag
Advances in sound and speech signal processing at the presence of drones
In: Quiet Drones: a Symposium on Noise from UASs/UAVs : 19 - 21 October 2020, Paris, France : an e-symposium : proceedings - INCEEUROPE . - 2020, insges. 17 S.
Alexa in the wild - collecting unconstrained conversations with a modern voice assistant in a public environment
In: LREC 2020 Marseille: Twelfth International Conference on Language Resources and Evaluation$dMay 11-16, 2020, Palais du Pharo, Marseille, France : conference proceedings/ International Conference on Language Resources and Evaluation - Paris: The European Language Resources Association (ELRA); Calzolari, Nicoletta . - 2020, S. 608-612
An analysis of the applicability of VoiceXML as basis for a dialog control flow in industrial interaction management
In: 2020 25th IEEE International Conference on Emerging Technologies and Factory Automation (ETFA): proceedings : Vienna, Austria - hybrid, 08-11 September, 2020/ IEEE International Conference on Emerging Technologies and Factory Automation - Piscataway, NJ: IEEE; IEEE International Conference on Emerging Technologies and Factory Automation (25.:2020) . - 2020, S. 30-37
Does users' system evaluation influence speech behavior in HCI? - first insights from the engineering and psychological perspective
In: Konferenz: 31. Konferenz \"Elektronische Sprachsignalverarbeitung\", Magdeburg, 4.-6. März 2020, Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress . - 2020, S. 241-248 - (Studientexte zur Sprachkommunikation; 95)
Emergency Service - Sprachbasierte Klassifikation eingehender Anrufe in Ausnahmesituationen
In: Konferenz: 31. Konferenz \"Elektronische Sprachsignalverarbeitung\", Magdeburg, 4.-6. März 2020, Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress; Wendemuth, Andreas . - 2020, S. 206-213 - (Studientexte zur Sprachkommunikation; 95)
Filtering-based analysis of spectral and temporal effects of room modes on low-level descriptors of emotionally coloured speech
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020: Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress; Wendemuth, Andreas . - 2020, S. 219-226 - (Studientexte zur Sprachkommunikation; 95)
GDPR - a game changer for acoustic interaction analyses
In: Proceedings of the LREC 2020 Workshop on Legal and Ethical Issues in Human Language Technologies (LEGAL2020) - proceedings: proceedings - Paris: European Language Resources Association (ELRA); Choukri, Khalid . - 2020, S. 1-3
Improving automatic speech recognition utilizing audio-codecs for data augmentation
In: IEEE 22nd International Workshop on Multimedia Signal Processing: MMSP 2020 : Tampere, Finland, September 21-24, 2020 - [Piscataway, NJ]: IEEE . - 2020
Investigation of the influence of standing waves on distant speech emotion recognition
In: Fortschritte der Akustik - DAGA 2020: 46. Jahrestagung für Akustik, 16.-19. März 2019 in Hannover - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2020, S. 822-825
Prosodic addressee-detection - ensuring privacy in always-on spoken dialog systems
In: Mensch und Computer 2020 - Tagungsband - New York, New York: The Association for Computing Machinery, Inc. . - 2020, S. 195-198
Recognition performance of selected speech recognition APIs - a longitudinal study
In: Speech and Computer - Cham: Springer; Karpov, Alexey . - 2020, S. 520-529 - ( Lecture notes in computer science; 12335)
Reduction of aircraft noise in UAV-based speech signal recordings by quantile based noise estimation
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020: Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress; Wendemuth, Andreas . - 2020, S. 149-156 - (Studientexte zur Sprachkommunikation; 95)
Speech communication at the presence of unmanned aerial vehicles
In: Fortschritte der Akustik - DAGA 2020: 46. Jahrestagung für Akustik, 16.-19. März 2019 in Hannover - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA) . - 2020, S. 952-955
Utilizing computer vision algorithms to detect and describe local features in images for emotion recognition from speech
In: Proceedings of the 2020 IEEE International Conference on Human-Machine Systems (ICHMS): Sept 7-9, 2020, Rome, Italy/ IEEE International Conference on Human-Machine Systems - [Piscataway, NJ]: IEEE; Weibkirchen, Norman . - 2020, insges. 6 S.
Herausgeberschaft
Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020
In: Dresden: TUDpress, 2020, XI, 288 Seiten, Illustrationen, Diagramme, 24 cm x 17 cm - (Studientexte zur Sprachkommunikation; Band 95)
Proceedings of the LREC 2020 Workshop on Legal and Ethical Issues in Human Language Technologies (LEGAL2020) - proceedings
In: Paris: European Language Resources Association (ELRA), 2020, 1 Elektronische Ressource
Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020 : [Abstractbook]
In: Magdeburg: Otto-von-Guericke-Universität Magdeburg, 2020, 1 Online-Ressource (39 Seiten, 0,3 MB)
2019
Abstract
Admitting the addressee-detection faultiness to improve the performance using a continous learning framework
In: 8. Interdisziplinärer Workshop Kognitive Systeme: Verstehen, Beschreiben und Gestalten Kognitiver (Technischer) Systeme - Duisburg: Universität Duisburg-Essen, S. 38-39, 2019
Buchbeitrag
Analysis of the influence of different room acoustics on acoustic emotion features
In: Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.): Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress, 2019 . - 2019, S. 156-163 - (Studientexte zur Sprachkommunikation; 93) ; [Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.), Dresden, 6.-8. März 2019]
Analysis of the influence of different room acoustics on acoustic emotion features and emotion recognition performance
In: Tagungsband - DAGA 2019 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA), 2019 . - 2019, S. 886-889
Anticipating the user - acoustic disposition recognition in intelligent interactions
In: Innovations in big data mining and embedded knowledge - Cham, Switzerland: Springer, 2019; Esposito, Anna . - 2019, S. 203-233 - (Intelligent systems reference library; volume 159)
Comparing phonetic changes in computer-directed and human-directed speech
In: Elektronische Sprachsignalverarbeitung 2019 - Dresden: TUDpress, S. 42-49 - (Studientexte zur Sprachkommunikation; 93) ; [Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019, Dresden, 6.-8. März 2019]
Cross-corpus data augmentation for acoustic addressee detection
In: 20th Annual Meeting of the Special Interest Group on Discourse and Dialogue/ Association for Computational Linguistics - Stroudsburg, PA: Association for Computational Linguistics (ACL); Nakamura, Satoshi . - 2019, S. 274-283
Dont talk to noisy drones - acoustic interaction with unmanned aerial vehicles
In: Speech and Computer - Cham: Springer International Publishing, S. 180-190, 2019 - (Lecture notes in articial intelligence; 11658)
The Restaurant Booking Corpus - content-identical comparative human-human and human-computer simulated telephone conversations
In: Elektronische Sprachsignalverarbeitung 2019 - Dresden: TUDpress, S. 126-133 - (Studientexte zur Sprachkommunikation; 93) ; [Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019, Dresden, 6.-8. März 2019]
Threes a crowd? - effects of a second human on vocal accommodation with a voice assistant
In: Interspeech 2019 - International Speech and Communication Association; Kubin, Gernot . - 2019, S. 4005-4009
2018
Begutachteter Zeitschriftenartikel
An experimental paradigm for inducing emotions in a real world driving scenario evidence from self-report, annotation of speech data and peripheral physiology
In: Kognitive Systeme - Duisburg: DuEPublico, 2013 . - 2018, 1, insges. 12 S.
How do we speak with ALEXA - subjective and objective assessments of changes in speaking style between HC and HH conversations
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2018, 1, insges. 11 S.
Using a PCA-based dataset similarity measure to improve cross-corpus emotion recogniton
In: Computer speech and language - London: Academic Press, 1986 . - 2018, insges. 31 S.
Using category theory to structure the OCC theory of emotions
In: Congreso Argentino de Ciencias de la Informática y Desarrollos de Investigación (CACIDI): 28 de noviembre al 30 de noviembre de 2018/ CACIDI- Piscataway, NJ: IEEE, 2018
Buchbeitrag
Acoustic addressee-detection - analysing the impact of age, sex and technical knowledge
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz \"Elektronische Sprachsignalverarbeitung\"- Dresden: TUDpress, 2018, S. 113-120 ; [Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 118-120]
Emotion recognition from disturbed speech - towards affective computing in real-world in-car environments
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz \"Elektronische Sprachsignalverarbeitung\"- Dresden: TUDpress, 2018, S. 208-215 ; [Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 214-215]
Improving emotion recognition performance by random-forest-based feature selection
In: Speech and computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018 : proceedings/ SPECOM - Cham: Springer, 2018 . - 2018, S. 134-144 - (Lecture notes in computer science; 11096; Lecture notes in artificial intelligence) ; [Konferenz: 20th International Conference Speech and Computer, SPECOM 2018, Leipzig, Germany, September 18-22, 2018]
Utilizing psychoacoustic modeling to improve speech-based emotion recognition
In: Speech and computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018 : proceedings/ SPECOM - Cham: Springer, 2018 . - 2018, S. 625-635 - (Lecture notes in computer science; 11096; Lecture notes in artificial intelligence) ; [Konferenz: 20th International Conference Speech and Computer, SPECOM 2018, Leipzig, Germany, September 18-22, 2018]
Voice Assistant Conversation Corpus (VACC) - a multi-scenario dataset for addressee detection in human-computer-interaction using Amazon's ALEXA
In: Proceedings of the LREC 2018 Workshop LB-ILR2018 and MMC2018 Joint Workshop, 7 May 2018, Miyazaki, Japan - Paris: European Language Resources Association, ELRA, 2018; Koiso, Hanae . - 2018, S. 51-54
2017
Begutachteter Zeitschriftenartikel
Prediction of user satisfaction in naturalistic human-computer interaction
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2017, 1, insges. 9 S.
Buchbeitrag
Accelerating manual annotation of filled pauses by automatic pre-selection
In: 2017 International Conference on Companion Technology (ICCT): 11-13 Sept. 2017/ International Conference on Companion Technology - [Piscataway, NJ]: IEEE, 2017; International Conference on Companion Technology (2.:2017) . - 2017, insges. 6 S.
Acoustic cues for the perceptual assessment of surround sound
In: Speech and Computer - Cham: Springer, S. 65-75, 2017 - (Lecture Notes in Computer Science; 10458)
Audio compression and its impact on emotion recognition in affective computing
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 1-8 ; [Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
Comparative study on normalisation in emotion recognition from speech
In: Intelligent Human Computer Interaction: 9th International Conference, IHCI 2017, Evry, France, December 11-13, 2017, Proceedings - Cham: Springer International Publishing, 2017; Horian, Patrick . - 2017, S. 189-201 - (Lecture Notes in Computer Science; 10688)
Emotion recognition from speech
In: Companion technology - a paradigm shift in human-technology interaction: a paradigm shift in human-technology interaction - Cham: Springer, 2017 . - 2017, S. 409-428
Improving speech-based emotion recognition by using psychoacoustic modeling and analysis-by-synthesis
In: Speech and Computer: 19th International Conference, SPECOM 2017, Hatfield, UK, September 12-16, 2017, Proceedings - Cham: Springer, 2017; Potapova, Rodmonga . - 2017, S. 445-455 - (Lecture Notes in Computer Science; 10458)
Modeling aspects in human-computer interaction - adaptivity, user characteristics and evaluation
In: Companion technology - a paradigm shift in human-technology interaction: a paradigm shift in human-technology interaction - Cham: Springer, 2017 . - 2017, S. 57-58
Multi-modal information processing in companion-systems - a ticket purchase system
In: Companion technology - a paradigm shift in human-technology interaction: a paradigm shift in human-technology interaction - Cham: Springer, 2017 . - 2017, S. 493-500
Multimodal affect recognition in the context of human-computer interaction for companion-systems
In: Companion technology - a paradigm shift in human-technology interaction: a paradigm shift in human-technology interaction - Cham: Springer, 2017 . - 2017, S. 387-408
The last minute corpus as a research resource - from signal processing to behavioral analyses in user-companion interactions
In: Companion technology - a paradigm shift in human-technology interaction: a paradigm shift in human-technology interaction - Cham: Springer, 2017 . - 2017, S. 277-299
ikannotate2 - a tool supporting annotation of emotions in audio-visual data
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 17-24 ; [Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
2016
Artikel in Kongressband
Integrated health and fitness (iGF)-corpus - ten-modal highly synchronized subject-dispositional and emotional human machine interactions
In: Multimodal Corpora: Computer vision and language processing (MMC 2016) - ELRA, S. 21-24
Begutachteter Zeitschriftenartikel
Comparison of different modeling techniques for robust prototype matching of speech pitch-contours
In: Kognitive Systeme - Duisburg: DuEPublico, 1, insges. 10 S., 2016
Emotional and user-specific acoustic cues for improved analysis of naturalistic interactions
In: Künstliche Intelligenz: KI : Forschung, Entwicklung, Erfahrungen : Organ des Fachbereichs 1 Künstliche Intelligenz der Gesellschaft für Informatik e.V., GI - Berlin: Springer, Bd. 30.2016, 1, S. 93-94
Buchbeitrag
Akustische Marker für eine verbesserte Situations- und Intentionserkennung von technischen Assistenzsystemen
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen: Zweite Transdisziplinäre Konferenz : Hamburg 2016 - Hamburg: Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität$, S. 465-474 ; [Kongress: 2. Transdisziplinäre Konferenz \"Technische Unterstützungssysteme, die die Menschen wirklich wollen\", Hamburg, 2016]
Classification of functional-meanings of non-isolated discourse particles in human-human-interaction
In: Human-computer interaction: 18th international conference, HCI International 2016, Toronto, ON, Canada, July 17-22, 2016 : proceedings, part I - Cham: Springer International Publishing, S. 53-64 - (Lecture Notes in Computer Science; 9731)
Discourse particles in human-human and human-computer interaction - Analysis and evaluation
In: Human-computer interaction - Cham: Springer International Publishing, S. 105-117, 2016
ERM4CT 2016: 2nd international workshop on emotion representations and modelling for companion systems (workshop summary)
In: Proceedings of the 18th ACM International Conference on Multimodal Interaction: November 12 - 16, 2016, Tokyo, Japan - New York, NY: ACM, S. 593-595
Emotion intelligibility within codec-compressed and reduced bandwidth speech
In: Speech communication: 12. ITG-Fachtagung Sprachkommunikation, 5.-7. Oktober 2016 in Paderborn - Berlin: VDE Verlag, S. 215-219 ; [Kongress: 12. ITG-Fachtagung Sprachkommunikation, Paderborn, 5. 7. Oktober 2016]
Kennzeichnung von Nutzerprofilen zur Interaktionssteuerung beim Gehen
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen: Zweite Transdisziplinäre Konferenz : Hamburg 2016 - Hamburg: Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität$, S. 475-484 ; [Kongress: 2. Transdisziplinäre Konferenz \"Technische Unterstützungssysteme, die die Menschen wirklich wollen\", Hamburg, 2016]
Measuring the impact of audio compression on the spectral quality of speech data
In: Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress, 2016; Jokisch, Oliver . - 2016, S. 229-236 - (Studientexte zur Sprachkommunikation; Band 81) ; [Kongress: 27. Konferenz Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch, Leipzig, 2. - 4. März 2016]
Multimodal information processing - the ticket purchase : a demonstration scenario of the SFB/TRR-62
In: Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016/ Konferenz \"Elektronische Sprachsignalverarbeitung\" - Dresden: TUDpress, 2016; Jokisch, Oliver . - 2016, S. 111-118 - (Studientexte zur Sprachkommunikation; Band 81) ; [Kongress: 27. Konferenz Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch, Leipzig, 2. - 4. März 2016]
2015
Artikel in Kongressband
A new dataset of telephone-based human-human call-center interaction with emotional evaluation
In: Proceedings of the 1st International Symposium on Companion-Technology (ISCT 2015): September 23rd - 25th, Ulm University, Germany, S. 143-148
Exploring dataset similarities using PCA-based feature selection
In: 2015 International Conference on Affective Computing and Intelligent Interaction (ACII): 21 - 24 Sept. 2015, Xi\'an - Piscataway, NJ: IEEE, 2015 . - 2015, S. 387-393
Probabilistic breadth used in evaluation of resulting gaussian mixture models
In: 4. Interdisziplinärer Workshop Kognitive Systeme 2015: Mensch, Teams, Systeme und Automaten: proceedings - Bielefeld, 2015 . - 2015, insges. 8 S. ; Kongress: Interdisziplinärer Workshop Kognitive Systeme 4 (Bielefeld : 2015.03.23-25)
Begutachteter Zeitschriftenartikel
Exploratory voice-controlled search for young users - Challenges & Potential Benefits
In: Kognitive Systeme - Duisburg: DuEPublico, 1, insges. 10 S., 2015
Probabilistic breadth as an evaluation measure of gaussian mixture models used for acoustic emotion states
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2015, 2, insges. 8 S.
Buchbeitrag
Automatic differentiation of form-function-relations of the discourse particle "hm" in a naturalistic human-computer interaction
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 / [26. Konferenz \"Elektronische Sprachsignalverarbeitung\"]. Günther Wirsching (Hrsg.). [Mitw. Förderverein Elektronische Sprachsignalverarbeitung e.V. Tagungsort Katholische Universität Eichstätt-Ingolstadt. Tagungsorganisation Katholische Universität Eichstätt-Ingolstadt, Lehrstuhl für Mathematik-Statistik]: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, 2015 . - 2015, S. 172-179 - (Studientexte zur Sprachkommunikation; 78) ; Kongress: Konferenz \"Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
ERM4CT 2015: Workshop on Emotion Representations and Modelling for Companion Systems
In: Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies - New York, NY: ACM, 2015; Hartmann, Kim . - 2015, S. 1-2
Ein Datenset zur Untersuchung emotionaler Sprache in Kundenbindungsdialogen
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, S. 180-187 - (Studientexte zur Sprachkommunikation; 78) ; Kongress: Konferenz \"Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
Emotion and disposition detection in medical machines - chances and challenges
In: Machine Medical Ethics - Cham: Springer, 2015; van Rysewyk, Simon Peter . - 2015, S. 317-339
Overlapping speech, utterance duration and affective content in HHI and HCI - an comparison
In: Proceedings of 6th IEEE Conference on Cognitive Infocommunications (CogInfoCom 2015) - Piscataway, NJ: IEEE, 2015 . - 2015, S. 83-88 ; Kongress: CogInfoCom 6 (Györ, Ungarn : 2015.10.19-21)
Recognising emotional evolution from speech
In: Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies - New York, NY: ACM, 2015; Hartmann, Kim . - 2015, S. 13-18
Dissertation
Emotional and user-specific cues for improved analysis of naturalistic interactions
In: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2015: Magdeburg, XIX, 266 S., graph. Darst.
Herausgeberschaft
Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies
In: New York, NY: ACM, 2015, Online Ressource (PDF-Datei)
2014
Artikel in Kongressband
Application of image processing methods to filled pauses detection from spontaneous speech
In: 15th annual conference of the International Speech Communication Association, INTERSPEECH: Singapore, 14 - 18 September 2014 - International Speech and Communication Association, S. 1816-1820 ; Kongress: INTERSPEECH 15 (Singapore : 2014.09.14-18)
Begutachteter Zeitschriftenartikel
Analysis of significant dialog events in realistic human-computer interaction
In: Journal on multimodal user interfaces - Berlin: Springer, 2007, Bd. 8.2014, 1, S. 75-86
Investigation of speaker group-dependent modelling for recognition of affective states from speech
In: Cognitive Computation - New York, NY: Springer, 2009, Bd. 6.2014, 4, S. 892-913
Buchbeitrag
Discourse particles and user characteristics in naturalistic human-computer interaction
In: Human-computer interaction: advanced interaction modalities and techniques ; 16th international conference, HCI International 2014, Heraklion, Crete, Greece, June 22 - 27, 2014 ; proceedings, part II - Cham [u.a.]: Springer, S. 492-501 - (Lecture notes in computer science; 8511)
Investigating the form-function-relation of the discourse particle hm in a naturalistic human-computer interaction
In: Recent Advances of Neural Network Models and Applications: Proceedings of the 23rd Workshop of the Italian Neural Networks Society (SIREN), May 23-25, Vietri sul Mare, Salerno, Italy/ Bassis - Cham: Springer International Publishing, 2014; Bassis, Simone . - 2014, S. 387-394 - (Smart Innovation, Systems and Technologies; 26)
2013
Begutachteter Zeitschriftenartikel
Inter-rater reliability for emotion annotation in human-computer interaction - comparison and methodological improvements
In: Journal on multimodal user interfaces - Berlin: Springer, 2007 . - 2013
Modelling of emotional development within human-computer-interaction
In: Kognitive Systeme. - Duisburg : DuEPublico, 1, insges. 8 S., 2013
Buchbeitrag
Annotation and classification of changes of involvement in group conversation
In: 2013 Humaine Association Conference on Affective Computing and Intelligent Interaction, ACII 2013: 2-5 September 2013, Geneva, Switzerland ; proceedings - Los Alamitos [u.a.]: IEEE, 2013 . - 2013, S. 803-808 ; Kongress: ACII (Geneva, Switzerland : 2013.09.02-05)
Audio-based pre-classification for semi-automatic facial expression coding
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 301-309 - (Lecture notes in computer science; 8008) ; Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Characterization of Lamb wave attenuation mechanisms
In: Health monitoring of structural and biological systems 2013 : 11 - 14 March 2013, San Diego, California, United States ; [part of SPIE smart structures/NDE]. - Bellingham, Wash. : SPIE - (Proceedings of SPIE; 8695)
Emotion detection in HCI - from speech features to emotion space?
In: 7th IFAC Conference on Manufacturing Modelling, Management, and Control, 2013. - IFAC, S. 288-295
Fusion of fragmentary classifier decisions for affective state recognition
In: Multimodal pattern recognition of social signals in human-computer-interaction : first IAPR TC3 workshop, MPRSS 2012, Tsukuba, Japan, November 11, 2012 ; revised selected papers. - Berlin [u.a.] : Springer, S. 116-130, 2013 - (Lecture notes in computer science; 7742)
Human behaviour in HCI - complex emotion detection through sparse speech features
In: Human behavior unterstanding : 4th international workshop, HBU 2013, Barcelona, Spain, October 22, 2013 ; proceedings. - Cham [u.a.] : Springer, S. 246-257 - (Lecture notes in computer science; 8212)
The influence of context knowledge for multi-modal affective annotation
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 381-390 - (Lecture notes in computer science; 8008) ; Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Using speaker group dependent modelling to improve fusion of fragmentary classifier decisions
In: Proceedings of the 2013 IEEE International Conference on Cybernetics (CYBCONF 2013) : Lausanne, Switzerland, 13-15 June, 2013. - IEEE, S. 132-137 ; Kongress: CYBCONF; (Lausanne, Switzerland) : 2013.06.13-15
Herausgeberschaft
Joint proceedings of the 2013th T2CT and CCGL workshops
In: Magdeburg: Otto von Guericke University Magdeburg, 2013, 1 CD-R, 12 cm ; Kongress: Workshop \"Techniques Towards Companion Technologies\", T2CT 13 (Edinburgh, UK : 2013.08.28)
2012
Abstract
Emotion detection by event evaluation using fuzzy sets as appraisal variables
In: Proceedings of ICCM 2012 : 11th International Conference on Cognitive Modeling. - Berlin : Universitätsverl. der TU Berlin, S. 123-124
Buchbeitrag
Combining mimic and prosodic analyses for user disposition classification
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 220 - (Studientexte zur Sprachkommunikation; 64) ; Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Describing human emotions through mathematical modelling
In: Preprints MATHMOD 2012 Vienna : abstract volume. - Vienna : ARGESIM, ARGE Simulation News, Vienna Univ. of Technology, insges. 6 S. - (ARGESIM report; 38)
Investigation of hierarchical classification for simultaneous gender and age recognition
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 58 - (Studientexte zur Sprachkommunikation; 64) ; Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Modeling users' mood state to improve human-machine-interaction
In: Cognitive behavioural systems - Berlin [u.a.]: Springer; Esposito, Anna . - 2012, S. 273-279 - (Lecture Notes in Computer Science; 7403)
Multimodal affect recognition in spontaneous HCI environment
In: 2012 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC 2012) : Hong Kong, China, 12-15 August 2012 ; proceedings. - Piscataway, NJ : IEEE, insges. 6 S. ; Kongress: ICSPCC; (Hong Kong) : 2012.08.12-15
The Influence of Context Knowledge for Multimodal Annotation
In: Joint proceedings of the IVA 2012 workshops - Santa Cruz, California, September 15, 2012 - Magdeburg: Univ. . - 2012, S. 25-31 ; Kongress: IVA 12 (Santa Cruz, Calif. : 2012.09.12-15)
Towards emotion and affect detection in the multimodal LAST MINUTE corpus
In: Proceedings of the 8th International Conference on Language Resources and Evaluation: May 23-25, 2012 / eds. Nicoletta Calzolari: May 23-25, 2012 - ELRA, 2012; Calzolari, Nicoletta . - 2012, S. 3064-3069 ; Kongress: LREC 2010 8 (Istanbul, Turkey : 2012.05.23-25)
2011
Abstract
Incorporation of a mood-model to improve user-disposition prediction from emotion recognition
In: Program and abstracts of the COST 2102 Final Conference: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany / Technische Universität Dresden, Institut für Akustik und Sprachkommunikation. [Ed. by Anna Esposito ...]: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany - Dresden: Techn. Univ., Inst. für Akustik und Sprachkommunikation, 2011; Esposito, Anna . - 2011, S. 34 ; [Kongress: COST 2102 Final Conference, Dresden, Germany, February 21 - 25, 2011]
Buchbeitrag
A processing tool for emotionally coloured speech
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 895, insgesamt 1 S. ; Kongress: ICME (Barcelona, Spain : 2011.07.11-15) ; [Beitrag auf USB-Stick]
Appropriate emotional labelling of non-acted speech using basic emotions, geneva emotion wheel and self assessment manikins
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 419, insgesamt 6 S. ; Kongress: ICME (Barcelona, Spain : 2011.07.11-15) ; [Beitrag auf USB-Stick]
Ikannotate - a tool for labelling, transcription, and annotation of emotionally coloured speech
In: Affective computing and intelligent interaction ; Pt. 1 - Heidelberg [u.a.]: Springer, 2011; Pt. 1 . - 2011, S. 25-34 - (Lecture notes in computer science; 6974) ; Kongress: ACII 4 (Memphis, TN : 2011.10.09-12)
Vowels formants analysis allows straightforward detection of high arousal emotions
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 631, insgesamt 6 S. ; Kongress: ICME (Barcelona, Spain : 2011.07.11-15) ; [Beitrag auf USB-Stick]
2010
Buchbeitrag
Developing an expressive speech labeling tool incorporating the temporal characteristics of emotion
In: Proceedings of the 7th International Conference on Language Resources and Evaluation: Workshops & Tutorials May 17-18, May 22-23, Main Conference May 19-21, Valletta - Paris: ELRA, 2010 . - 2010, S. 1172-1175
the following publications are accepted but not yet published
Ingo Siegert & Julia Krüger: “Speech melody and speech content didn’t fit together” – Differences in Speech Behavior for Device Directed and Human Directed Interactions.
Advances in Data Science: Methodologies and Applications, in print.
Ingo Siegert. Alicia Flores Lotz, Andreas Wendemuth: Emotionserkennung für eine nutzerzentrierte Fahrerassistenz – Affective Computing im realem Fahrzeugkontext
11. Symposium "Motor- und Aggregateakustik" (accepted)
Oliver Jokisch, Enrico Lösch and Ingo Siegert Advances in sound and speech signal processing at the presence of drones
Accepted for Quiet Drones - A Symposium on Noise from UASs/UAVs
Ingo Siegert “Alexa in the wild” – Collecting unconstrained conversations with a modern voice assistant in a public environment
Accepted for LREC 2020
Norman Weißkirchen, Mainampati Vasudeva Reddy, Andreas Wendemuth and Ingo Siegert. Utilizing Computer Vision Algorithms to Detect and Describe Local Features in Images for Emotion Recognition from Speech. Accepted for ICHMS 2020.
Organiser
Conferences
ESSV 2020, 31. Konferenz Elektronische Sprachverarbeitung, 4-6 März, 2020, Magdeburg, Co-Organisator
SPECOM 2018, 20th International Conference on Speech and Computer, 18-22 September, 2018, Leipzig, Germany, Local Organizing Committee – Special Session Chair
Summer Schools
International Summer School on Companion Technology (ISSCT 2017) - Theory and Application
In conjunction with the IEEE International Conference on Companion Technology, Ulm, Germany
September 9-13, 2017
Workshops
LREC Workshop Legal and Ethical Issues Workshop, Mai 2020, Co-Organisator
ITG-Workshop Sprachassistenten: Anwendungen, Implikationen, Entwicklungen, 3 März 2020, Magdeburg, Co-Organisator
For further information: click here
2nd International Workshop on Emotion Representations and Modelling for Companion Technologies (ERM4CT 2016),
Workshop at ICMI 2016 (18th ACM International Conference on Multimodal Interaction),
Seattle, USA, November 16th, 2016
For further information: click here
International Workshop on Emotion Representations and Modelling for Companion Technologies (ERM4CT 2015),
Workshop at ICMI 2015 (17th ACM International Conference on Multimodal Interaction),
Seattle, USA, November 13th, 2015
For further information: click here
1st International Workshop on Techniques Towards Companion Technologies (T2CT 2013)
Workshop at IVA 2013 (International Conference on Intelligent Virtual Agents), Edinburgh, UK
August 28, 2013
For further information: click here
Editorships
Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg, 4. - 6. März 2020.
Eds.: Andreas Wendemuth, Ronald Böck, Ingo Siegert.
Dresden: TUDpress, 2020
Sprachassistenten - Anwendungen, Implikationen, Entwicklungen : ITG-Workshop : Magdeburg, 3. März, 2020. Abstractbook.
Eds.: Ingo Siegert, Sebastian Möller
Unibibliothek Magdeburg
ERM4CT '16: Proceedings of the 2nd International Workshop on Emotion Representations and Modelling for Companion Technologies.
Eds.: Kim Hartmann, Ingo Siegert, Ali Albert Salah and Khiet P. Truong.
ACM, New York, NY, USA, 2016
Proceedings of the International Workshop on Emotion Representations and Modelling for Companion Technologies.
Eds: Kim Hartmann, Ingo Siegert, Björn Schuller, Louis-Philippe Morency, Albert Ali Salah and Ronald Böck
ACM, New York, NY, USA, 2015
Joint Proceedings of the 2013th T2CT and CCGL Workshops,
Eds: Ronald Böck, Nick Degens, Dirk Heylen, Sandy Louchart, Wolfgang Minker, Louis-Philippe Morency, Asad Nazir, Friedhelm Schwenker, Ingo Siegert
Edinburgh, UK, August 28, 2013
Publisher: Otto von Guericke University Magdeburg,
ISBN: 978-3-940961-99-0.
invited Talks
2020 -- Siri, Alexa & Co: Wie können Dialoge mit Sprachassistenten natürlicher werden und warum können diese mir nicht einfach mal meine Fragen beantworten?
Vortrag im Rahmen der Vortragsreihe "Wissenschaft im Rathaus" Magdeburg
2020 -- Differences in Speech Behavior for Human-Directed and Device Directed Speech for the application of Addressee-Detection
Kolloqium an der Universität des Saarlandes Fachrichtung Sprachwissenschaft und Sprachtechnologie, Saarbrücken
2019 -- Wie finden wir es, wenn Maschinen uns Persönliches fragen?
Mitmachwerkstatt auf der KI&Wir Convention Magdeburg
2019 -- Rendezvous mit Mr(s) Robot - Liebe auf das erste BYTE? Ein Blick auf die aktuelle Forschung im Bericht der Mensch-Maschine-Interaktion.
Filmgespräch im Rahmen des SILBERSALZ Science & Media Festival 2019
2019 -- Speech Technology for Human-Machine-Interaction
Vortrag auf dem KI@OVGU Symposium in Magdeburg
2019 -- Meet the Scientist Magdeburg "Der (in-)kompetente Helfer" im Rahmen der Wissenschaftsausstellung auf der MS Wissenschaft
Wie Menschen mit einem digitalen Sprachassistenten sprechen müssen, damit er sie versteht.
2018 -- Smarte Systeme vermitteln (Bachelor) - Smarte Ingenieure für die Industrie
Co-Speaker, NI Technologie- und Anwenderkongress VIP 2018
2017 – Freud und Leid am Ticketautomaten – Situations- und Dispositionserkennende Companiontechnologie,
Gastvortrag an der Hochschule für Telekommunikation, Leipzig
2015 – Situations- und Dispositionserkennende Companiontechnologie – Vortrag im Rahmen der Auszeichnung „Deutschland Land der Ideen“ an den SFB/TRR-62
2013 – Companion-Technology – The Future of Cognitive Technical Systems, Introduction talk at the 1st International Workshop on Techniques Towards Companion
Technologies
Awards
Ronald Böck, Olga Egorow, Ingo Siegert und Andreas Wendemuth. “Comparative Study on Normalisation in Emotion Recognition from Speech”. In: Proceedings
of the 9th International Conference on Intelligent Human Computer Interaction (IHCI 2017). Hrsg. von Patrick Horain, Catherine Achard und Malik Mallem. Cham: Springer International Publishing, 2017, S. 189–201, Best Paper Award.
Current Projects
- Medinym - KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen
Duration: 15.12.2022 - 14.12.2025 - AnonymPrevent - AI-based Improvement of Anonymity for Remote Assessment, Treatment and Prevention against Child Sexual Abuse
Duration: 01.12.2021 - 30.11.2024 - Emonymous -Sprecheranonymisierung unter Erhalt der emotionalen Ausdruckswirkung
Duration: 01.08.2021 - 31.07.2023 - MusIAs - Musik-geleitete Imagination und Digitaler Sprachassistent - eine Pilotstudie
Duration: 01.01.2021 - 30.06.2023
Completed Projects
- Wahrnehmung der paraverbalen Information in datenreduzierter gesprochener Sprache bei Nutzern von Cochlea-Implantaten
Duration: 15.08.2020 - 28.02.2022 - Unterschiede im Sprechverhalten von Nutzern zwischen Mensch-Maschine- und Mensch-Mensch-Interaktionen ("Alexa-Studien")
Duration: 01.11.2018 - 30.06.2021 - "Finde deinen Studiengang" - Eine sprachgeführte Hilfe zur Studieninformation an der OvGU
Duration: 01.02.2020 - 28.02.2021 - ADAS&ME : Adaptive leistungsfähige Fahrer-Assistenzsysteme zur Unterstützung von beanspruchten Fahrern & Effektives Abfangen von Risiken durch maßgeschneiderte Mensch-Maschine-Interaktion in der Fahrzeugautomatisierung
Duration: 01.09.2016 - 28.02.2020
I had the honor to sipervise the following students
2017
Mainampati Vasudeva Reddy
Overview and Comparison of Computer Vision Algorithms to Detect and Describe Local Features in Images'
Non-Technical Project Report
Tang Shuran
Analysis of acoustic features and automatic recognition experiments for conversation addressee detection
Masterarbeit
2016
Thomas Aab
Datenvorverarbeitung und Klassifizierung von Kopfdrehungen und Kopfbeschleunigung mittels MEMS Sensorik
Bachelorarbeit
Srinivasa Rao Peddi
Implementation and Investigations of Broad Phoneme Recognisers for Discourse Particle Detection
Masterarbeit
Linh Linda Duong
Untersuchung des Einflusses unterschiedlicher Audiospeicherformate und Kompressionsformate auf die Audioqualität
Bachelorarbeit (Betreuung als Kooperation mit Alicia Lotz)
Somtapa Bhattacharya
Implementation of improved Methods for Voice Activity Detection
Technical Project
Somtapa Bhattacharya
Evolution of Speech Processing
Non-technical Project
Daile Vera Poungue Wetoumdu
Überlappung in der Mensch-Maschine-Interaktion
Forschungsprojekt
2015
Fengjie Zhang
Comparison of Speech Emotion Recognition using Neural Networks and Deep Belief Networks having limited data material
Master Thesis
Yu Bi
Investigations on Wuality Asessment for Emotion Speech Data
Master Thesis
Bharath Bhat
Overlapping Speech
Non-technical Project
2014
Alicia Flores Lotz
Differentiation von Form-Funktions-Verläufen des Diskurspartikels "hm" über unterschiedliche mathematische Herangehensweisen
Masterarbeit
René Kallweit
Sprachsteuerung eines Roboters über eine Raspberry Pi bzw. Arduino Plattform
Masterarbeit
2012
Thomas Willner
Zerstörungsfreie Werkstoffprüfung von PMMA-Scheiben mit Hilfe von Lambwellen und digitalen Filtern
Studienarbeit
Christian Sporleder
Zerstörungsfreie Werkstoffprüfung von PMMA-Scheiben mit Hilfe von Lambwellen zur Detektion von Beschädigungen
Studienarbeit
Daniel Hellge-Theune
Erstellung und Evaluierung einer parametrisierbaren Onlineabfrage für ein Phonemlexikon der deutschen Sprache
Forschungsprojekt
- regiocom SE
- Otto-von-Guericke-Universität, AiLab, Prof. Sebastian Stober
- Otto-von-Guericke-Universität Magdeburg Medizinische Fakultät Universitätsklinik für Hals-, Nasen- und Ohrenheilkunde, Kopf- und Halschirurgie Abteilung für Experimentelle Audiologie, Prof. Dr. Jesko Verhey
- Otto-von-Guericke-Universität, Arbeitsgruppe Logistische Systeme, Dr. Tobias Reggelin
- Hochschule Anhalt
- Universitätsklinik für Psychosomatische Medizin und Psychotherapie, Dr. Julia Krüger, Prof. Dr. Jörg Frommer
- Charit Universitätsmedizin Berlin, Institut für Sexualwissenschaft und Sexualmedizin, Prof. Dr. Dr. Klaus Beier
- Prof. Dr. Susanne Metzner, Wiss. Leitung Studien- und Forschungsbereich Musiktherapie, Leopold-Mozart-Zentrum, Universität Augsburg
- Otto von Guericke Universität, Hochschulforschung und Professionalisierung der akademischen Lehre, Prof. Philipp Pohlenz
- Hochschule für Telekommunikation (HfTL), Leipzig, Prof. Dr. Oliver Jokisch
- University of Southern Queensland, Toowoomba, Australien, Dr. Rajib Rana
- NDR Kultur, Michael Becker
- DFKI Berlin Speech and Language Technology (SLT), Berlin
- Hochschule Harz
- Hochschule Magdeburg-Stendal
- Technische Universität Berlin, Quality and Usability Labs
- Otto von Guericke Universität, Institut für Strömungstechnik und Thermodynamik, apl. Prof. Gabor Janiga
- Ludwig-Maximilians-Universität München, Department Psychologie, Lehrstuhl psychologische Methodenlehre und Diagnostik
- Hochschule Merseburg