Skip to main content

2023 | OriginalPaper | Buchkapitel

4. KI-basiertes akustisches Monitoring: Herausforderungen und Lösungsansätze für datengetriebene Innovationen auf Basis audiovisueller Analyse

verfasst von : Patrick Aichroth, Judith Liebetrau

Erschienen in: Entrepreneurship der Zukunft

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

KI-basierte audiovisuelle Analyse kann datengetriebene Produkt-, Prozess- und auch Geschäftsmodellinnovationen in verschiedenen Anwendungsbereichen befördern. Allerdings müssen dafür wichtige Herausforderungen bezüglich Datenerhebung, Datenschutz, Datensicherheit, sowie von Erklärbarkeit und iterativer Entwicklung von KI-Modellen adressiert werden. In diesem Kapitel werden die Innovationspotenziale, relevante Probleme und Lösungsansätze am Beispiel von akustischem Monitoring erläutert. Dabei wird deutlich, dass der frühzeitige Einsatz von Verfahren und Technologien für vertrauenswürdige KI, adäquate Entwicklungsmethoden und systematische Evaluationsprozesse entscheidend für einen erfolgreichen Einsatz und die Realisierung der Innovationspotenziale sind.
Verfahren und Komponenten für audiovisuelle Analyse sind Algorithmen, die Informationen aus Bild, Video- und Audiomaterial extrahieren. Sie können in vielen Anwendungsbereichen wichtige Bausteine für datengetriebene Innovationen sein. Einige dieser Innovationen, und in diesem Zusammenhang relevante Herausforderungen und Lösungsansätze, werden in diesem Kapitel exemplarisch anhand des KI-basierten akustischen Monitorings zur Überwachung von Prozessen, Maschinen und Produkten beschrieben.
Das Kapitel gliedert sich in drei Teile:
1.
Definition relevanter Begrifflichkeiten und Beschreibung der Anwendungsbereiche und Potenziale von akustischem Monitoring für datengetriebene Geschäftsmodelle,
 
2.
Erläuterung zentraler Herausforderungen im Kontext von Datenerhebung, Datenschutz, Datensicherheit, Erklärbarkeit, iterativer Entwicklung und Evaluation für die Erschließung der o. g. Potenziale, sowie
 
3.
Zusammenfassung der Ergebnisse und kurzer Ausblick auf relevante Trends.
 

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Frei verfügbare und häufig genutzte Datensets sind zum Beispiel über die Plattformen zenodo (https://​zenodo.​org/​), datahub.io (https://​datahub.​io/​machine-learning), Kaggle (https://​www.​kaggle.​com/​datasets) oder VisualData (https://​visualdata.​io/​discovery) verfügbar.
 
Literatur
Zurück zum Zitat Abeßer, J., Loos, A., & Prachi, S. (2022). Construction-sAIt: Multi-modal AI-driven technologies for construction site monitoring. In P. Leistner (Hrsg.), Fortschritte der Akustik – DAGA 2022: 48. Jahrestagung für Akustik (S. 90–93). Berlin. Abeßer, J., Loos, A., & Prachi, S. (2022). Construction-sAIt: Multi-modal AI-driven technologies for construction site monitoring. In P. Leistner (Hrsg.), Fortschritte der Akustik – DAGA 2022: 48. Jahrestagung für Akustik (S. 90–93). Berlin.
Zurück zum Zitat Abeßer, J., Gourishetti, S., Kátai, A., Clauß, T., Sharma, P., & Liebetrau, J. (2021). IDMT-Traffic: An Open Benchmark Dataset for Acoustic Traffic Monitoring Research. In Proceedings of the 29th European Signal Processing Conference (EUSIPCO), (S. 551–555). Abeßer, J., Gourishetti, S., Kátai, A., Clauß, T., Sharma, P., & Liebetrau, J. (2021). IDMT-Traffic: An Open Benchmark Dataset for Acoustic Traffic Monitoring Research. In Proceedings of the 29th European Signal Processing Conference (EUSIPCO), (S. 551–555).
Zurück zum Zitat Abeßer, J., Götze, M., Clauß, T., Zapf, D., Kühn, C., Lukashevich, H., Kühnlenz, S., & Mimilakis, S. (2019). Urban Noise Monitoring in the Stadtlärm Project – A Field Report. In Proceedings of the Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE2019). New York: New York University, 25–26 October 2019. Abeßer, J., Götze, M., Clauß, T., Zapf, D., Kühn, C., Lukashevich, H., Kühnlenz, S., & Mimilakis, S. (2019). Urban Noise Monitoring in the Stadtlärm Project – A Field Report. In Proceedings of the Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE2019). New York: New York University, 25–26 October 2019.
Zurück zum Zitat Aichroth, P., Battis, V., Dewes, A., Dibak, C., Doroshenko, V., Geiger, B., Graner, L., Holly, S., Huth, M., Kämpgen, B., Kaulartz, M., Mundt, M., Rapp, H., Steinebach, M., Sushko, Y., Swarat, D., Winter, C., & Weiß, R. (2020). Anonymisierung und Pseudonymisierung von Daten für Projekte des maschinellen Lernens: Eine Handreichung für Unternehmen. BITKOM. Aichroth, P., Battis, V., Dewes, A., Dibak, C., Doroshenko, V., Geiger, B., Graner, L., Holly, S., Huth, M., Kämpgen, B., Kaulartz, M., Mundt, M., Rapp, H., Steinebach, M., Sushko, Y., Swarat, D., Winter, C., & Weiß, R. (2020). Anonymisierung und Pseudonymisierung von Daten für Projekte des maschinellen Lernens: Eine Handreichung für Unternehmen. BITKOM.
Zurück zum Zitat Arrieta, A. B., Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., Garc’ia, S., Gil-L’opez, S., Molina, D., Benjamins, R., Chatila, R., & Herrera, F. (2020). Explainable artificial intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion, 58, 82–115. Arrieta, A. B., Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., Garc’ia, S., Gil-L’opez, S., Molina, D., Benjamins, R., Chatila, R., & Herrera, F. (2020). Explainable artificial intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion, 58, 82–115.
Zurück zum Zitat Balke, S., Driedger, J., Abeßer, J., Dittmar, C., & Müller, M. (2016). Towards evaluating multiple predominant melody annotations in Jazz Recordings. In Proceedings of the 17th International Society for Music Information Retrieval Conference, ISMIR 2016, New York (S. 246–252). Balke, S., Driedger, J., Abeßer, J., Dittmar, C., & Müller, M. (2016). Towards evaluating multiple predominant melody annotations in Jazz Recordings. In Proceedings of the 17th International Society for Music Information Retrieval Conference, ISMIR 2016, New York (S. 246–252).
Zurück zum Zitat Becker, C., & Mohr, M. (2020). Federated Machine Learning: über Unternehmensgrenzen hinaus aus Produktionsdaten lernen. atp magazin. 62(5), 18–20. Becker, C., & Mohr, M. (2020). Federated Machine Learning: über Unternehmensgrenzen hinaus aus Produktionsdaten lernen. atp magazin. 62(5), 18–20.
Zurück zum Zitat Biedermann, H. (2008). Anlagenmanagement–Managementinstrumente zur Wertsteigerung. TÜV Media. Biedermann, H. (2008). Anlagenmanagement–Managementinstrumente zur Wertsteigerung. TÜV Media.
Zurück zum Zitat Biedermann, H. (2014). Anlagenmanagement im Zeitalter von Industrie 4.0 – Handlungsfelder für die industrielle Instandhaltung. In Instandhaltung im Wandel (S. 23–32). Biedermann, H. (2014). Anlagenmanagement im Zeitalter von Industrie 4.0 – Handlungsfelder für die industrielle Instandhaltung. In Instandhaltung im Wandel (S. 23–32).
Zurück zum Zitat Bittner, F., Gonzalez Rodriguez, M., Richter, M., Lukashevich, H., & Abeßer, J. (2022). Multi-pitch Estimation meets Microphone Mismatch: Applicability of Domain Adaptation. In Proceedings of 23rd International Society for Music Information Retrieval Conference (ISMIR 2022). Bengaluru, 4–8 December 2022. Bittner, F., Gonzalez Rodriguez, M., Richter, M., Lukashevich, H., & Abeßer, J. (2022). Multi-pitch Estimation meets Microphone Mismatch: Applicability of Domain Adaptation. In Proceedings of 23rd International Society for Music Information Retrieval Conference (ISMIR 2022). Bengaluru, 4–8 December 2022.
Zurück zum Zitat Bouee, C. E., & Schaible, S. (2015). Die digitale Transformation der Industrie. Roland Berger/BDI. Bouee, C. E., & Schaible, S. (2015). Die digitale Transformation der Industrie. Roland Berger/BDI.
Zurück zum Zitat Cano, E., Plumbley, M., & Dittmar, C. (2014a). Phase-based harmonic/percussive separation. In Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH), Singapore (S. 1628–1632). Cano, E., Plumbley, M., & Dittmar, C. (2014a). Phase-based harmonic/percussive separation. In Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH), Singapore (S. 1628–1632).
Zurück zum Zitat Cano, E., Schuller, G., & Dittmar, C. (2014b). Pitch-informed solo and accompaniment separation towards its use in music education applications. EURASIP Journal on Advances in Signal Processing, 1, 1–19. Cano, E., Schuller, G., & Dittmar, C. (2014b). Pitch-informed solo and accompaniment separation towards its use in music education applications. EURASIP Journal on Advances in Signal Processing, 1, 1–19.
Zurück zum Zitat Carletti, M., Masiero, C., Beghi, A., & Susto, G. A. (2019). Explainable machine learning in industry 4.0: Evaluating feature importance in anomaly detection to enable root cause analysis. In Proceedings of the 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC), Bari (S. 21–26). Carletti, M., Masiero, C., Beghi, A., & Susto, G. A. (2019). Explainable machine learning in industry 4.0: Evaluating feature importance in anomaly detection to enable root cause analysis. In Proceedings of the 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC), Bari (S. 21–26).
Zurück zum Zitat Cartwright, M., Seals, A., Salamon, J., Williams, A., Mikloska, S., MacConnell, D., Law, E., Bello, J., & Nov., O. (2017). Seeing sound: Investigating the effects of visualizations and complexity on crowdsourced audio annotations. In Proceedings of the ACM on Human-computer Interaction. Issue CSCW, 1–21. Cartwright, M., Seals, A., Salamon, J., Williams, A., Mikloska, S., MacConnell, D., Law, E., Bello, J., & Nov., O. (2017). Seeing sound: Investigating the effects of visualizations and complexity on crowdsourced audio annotations. In Proceedings of the ACM on Human-computer Interaction. Issue CSCW, 1–21.
Zurück zum Zitat Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection. ACM Computing Surveys (CSUR), 41(3), 1–58. Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection. ACM Computing Surveys (CSUR), 41(3), 1–58.
Zurück zum Zitat Chen, H., Liu, Z., Liu, Z., Zhang, P., & Yan, Y. (2019). Integrating the data augmentation scheme with various classifiers for acoustic scene modeling. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York (S. 25–26). Chen, H., Liu, Z., Liu, Z., Zhang, P., & Yan, Y. (2019). Integrating the data augmentation scheme with various classifiers for acoustic scene modeling. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York (S. 25–26).
Zurück zum Zitat Chen, H., Tao, R., Fan, Y., Wang, Y., Wang, J., Schiele, B., Xie, X., Raj, B., & Savvides, M. (2022). SoftMatch: Addressing the Quantity-Quality Tradeoff in Semi-supervised Learning. The Eleventh International Conference on Learning Representations. https://openreview.net/forum?id=ymt1zQXBDiF. Chen, H., Tao, R., Fan, Y., Wang, Y., Wang, J., Schiele, B., Xie, X., Raj, B., & Savvides, M. (2022). SoftMatch: Addressing the Quantity-Quality Tradeoff in Semi-supervised Learning. The Eleventh International Conference on Learning Representations. https://​openreview.​net/​forum?​id=​ymt1zQXBDiF.
Zurück zum Zitat Clauß, T., Abeßer, J., Lukashevich, H., Gräfe, R., Häuser, F., Kühn, C., & Sporer, Thomas. (2018). Stadtlärm – A distributed system for noise level measurement and noise source identification in a smart city environment. In B. Seeber (Hrsg.), Fortschritte der Akustik – DAGA 2018: 44. Jahrestagung für Akustik (S. 285–288). München. Clauß, T., Abeßer, J., Lukashevich, H., Gräfe, R., Häuser, F., Kühn, C., & Sporer, Thomas. (2018). Stadtlärm – A distributed system for noise level measurement and noise source identification in a smart city environment. In B. Seeber (Hrsg.), Fortschritte der Akustik – DAGA 2018: 44. Jahrestagung für Akustik (S. 285–288). München.
Zurück zum Zitat Cuccovillo, L., & Aichroth, P. (2016). Open-set microphone classification via blind channel analysis. In Proceedings of the 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Shanghai (S. 2074–2078). Cuccovillo, L., & Aichroth, P. (2016). Open-set microphone classification via blind channel analysis. In Proceedings of the 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Shanghai (S. 2074–2078).
Zurück zum Zitat Cuccovillo, L., Mann, S., Aichroth, P., Tagliasacchi, M., & Dittmar, C. (2013a). Blind microphone analysis and stable tone phase analysis for audio tampering detection. In Proceedings of the 135th Audio Engineering Society convention, New York (S. 271–280). Cuccovillo, L., Mann, S., Aichroth, P., Tagliasacchi, M., & Dittmar, C. (2013a). Blind microphone analysis and stable tone phase analysis for audio tampering detection. In Proceedings of the 135th Audio Engineering Society convention, New York (S. 271–280).
Zurück zum Zitat Cuccovillo, L., Mann, S, Tagliasacchi, M., & Aichroth, P. (2013b). Audio tampering detection via microphone classification. In Proceedings of the 2013b IEEE International Workshop on Multimedia Signal Processing (MMSP), Pula (S. 177–182). Cuccovillo, L., Mann, S, Tagliasacchi, M., & Aichroth, P. (2013b). Audio tampering detection via microphone classification. In Proceedings of the 2013b IEEE International Workshop on Multimedia Signal Processing (MMSP), Pula (S. 177–182).
Zurück zum Zitat DA3KMU. (o. J.). Datenschutz durch statistische Analyse und Adaptive Anonymisierung von personenbezogenen Daten für KMU https://www.da3kmu.de. Zugegriffen: 28. Nov. 2021. DA3KMU. (o. J.). Datenschutz durch statistische Analyse und Adaptive Anonymisierung von personenbezogenen Daten für KMU https://​www.​da3kmu.​de. Zugegriffen: 28. Nov. 2021.
Zurück zum Zitat Denkena, B., Dittrich, M., Noske, H., Kramer, K., & Schmidt, M. (2021). Anwendungen des maschinellen Lernens in der Produktion aus Auftrags- und Produktsicht: Ein Überblick. Zeitschrift für wirtschaftlichen Fabrikbetrieb, 116(5), 358–362. Denkena, B., Dittrich, M., Noske, H., Kramer, K., & Schmidt, M. (2021). Anwendungen des maschinellen Lernens in der Produktion aus Auftrags- und Produktsicht: Ein Überblick. Zeitschrift für wirtschaftlichen Fabrikbetrieb, 116(5), 358–362.
Zurück zum Zitat Došilović, F. K., Brčić, M., & Hlupić, N. (2018). Explainable artificial intelligence: A survey. In Proceedings of the 2018 41st International convention on information and communication technology, electronics and microelectronics (MIPRO), Opatija (S. 0210–0215). Došilović, F. K., Brčić, M., & Hlupić, N. (2018). Explainable artificial intelligence: A survey. In Proceedings of the 2018 41st International convention on information and communication technology, electronics and microelectronics (MIPRO), Opatija (S. 0210–0215).
Zurück zum Zitat Gassmann, O., Frankenberger, K., & Choudury, M. (2020). Geschäftsmodelle entwickeln: 55+ innovative Konzepte mit dem St. Galler Business Model Navigator (3., überarbeitete und erweiterte Edition). Carl Hanser. Gassmann, O., Frankenberger, K., & Choudury, M. (2020). Geschäftsmodelle entwickeln: 55+ innovative Konzepte mit dem St. Galler Business Model Navigator (3., überarbeitete und erweiterte Edition). Carl Hanser.
Zurück zum Zitat Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B.g, Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. In Proceedings of the 27th International Conference on Neural Information Processing Systems – Volume 2 (NIPS'14) (S. 2672–2680). MIT Press. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B.g, Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. In Proceedings of the 27th International Conference on Neural Information Processing Systems – Volume 2 (NIPS'14) (S. 2672–2680). MIT Press.
Zurück zum Zitat Gudivada, V., Apon, A., & Ding, J. (2017). Data quality considerations for big data and machine learning: Going beyond data cleaning and transformations. International Journal on Advances in Software, 10(1), 1–20. Gudivada, V., Apon, A., & Ding, J. (2017). Data quality considerations for big data and machine learning: Going beyond data cleaning and transformations. International Journal on Advances in Software, 10(1), 1–20.
Zurück zum Zitat Hartz, C. (2021). Künstliche Intelligenz in der Produktentwicklung im Spannungsfeld zwischen juristischer Perfektion und technischer Machbarkeit. LRZ 2021, Rn. 260–294. Hartz, C. (2021). Künstliche Intelligenz in der Produktentwicklung im Spannungsfeld zwischen juristischer Perfektion und technischer Machbarkeit. LRZ 2021, Rn. 260–294.
Zurück zum Zitat Hennequin, R., Khlif, A., Voituret, F., & Moussallam, M. (2020). Spleeter: A fast and efficient music source separation tool with pre-trained models. Journal of Open Source Software, 5(50), 2154. Hennequin, R., Khlif, A., Voituret, F., & Moussallam, M. (2020). Spleeter: A fast and efficient music source separation tool with pre-trained models. Journal of Open Source Software, 5(50), 2154.
Zurück zum Zitat Hoffmann, K. (2008). Projektmanagement heute. HMD Praxis der Wirtschaftsinformatik, 45(2), 5–16. Hoffmann, K. (2008). Projektmanagement heute. HMD Praxis der Wirtschaftsinformatik, 45(2), 5–16.
Zurück zum Zitat Jo, T. (2021). Machine learning foundations. Springer. Jo, T. (2021). Machine learning foundations. Springer.
Zurück zum Zitat Johnson, D., Kirner, J., Grollmisch, S., & Liebetrau, J. (2020). Compressed Air Leakage Detection Using Acoustic Emissions with Neural Networks. INTER-NOISE and NOISE-CON Congress and Conference Proceedings, 261(1), 5662–5673. Johnson, D., Kirner, J., Grollmisch, S., & Liebetrau, J. (2020). Compressed Air Leakage Detection Using Acoustic Emissions with Neural Networks. INTER-NOISE and NOISE-CON Congress and Conference Proceedings, 261(1), 5662–5673.
Zurück zum Zitat Jones, M. C., Downie, J. S., & Ehmann, A. F. (2007). In Proceedings of the 8th International Conference on Music Information Retrieval (ISMIR 2007), Vienna (S. 539-542). Jones, M. C., Downie, J. S., & Ehmann, A. F. (2007). In Proceedings of the 8th International Conference on Music Information Retrieval (ISMIR 2007), Vienna (S. 539-542).
Zurück zum Zitat Kodrasi, I., Goetze, S., & Doclo, S. (2013). Regularization for partial multichannel equalization for speech dereverberation. IEEE Transactions on Audio, Speech and Language Processing, 21(9), 1879–1890. Kodrasi, I., Goetze, S., & Doclo, S. (2013). Regularization for partial multichannel equalization for speech dereverberation. IEEE Transactions on Audio, Speech and Language Processing, 21(9), 1879–1890.
Zurück zum Zitat Kong, Q., Xu, Y., Iqbal, T., Cao, Y., Wang, W., & Plumbley, M.D. (2019). Acoustic Scene Generation with Conditional SampleRNN. In Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton (S. 925–929). Kong, Q., Xu, Y., Iqbal, T., Cao, Y., Wang, W., & Plumbley, M.D. (2019). Acoustic Scene Generation with Conditional SampleRNN. In Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton (S. 925–929).
Zurück zum Zitat Kouw, W. M., & Loog, M. (2021). A review of domain adaptation without target labels. IEEE Transactions on Pattern Analysis and Machine Intelligence, 43(3), 766–785. Kouw, W. M., & Loog, M. (2021). A review of domain adaptation without target labels. IEEE Transactions on Pattern Analysis and Machine Intelligence, 43(3), 766–785.
Zurück zum Zitat Kraus, T., Ganschow, L., Eisenträger, M., & Wischmann, S. (2021). Erklärbare Künstliche Intelligenz – Anforderungen, Anwendungen, Lösungen. Technologieprogramm KI-Innovationswettbewerb des Bundesministeriums für Wirtschaft und Energie/Begleitforschung: Iit-Institut für Innovation und Technik in der VDI/VDE Innovation + Technik GmbH. Kraus, T., Ganschow, L., Eisenträger, M., & Wischmann, S. (2021). Erklärbare Künstliche Intelligenz – Anforderungen, Anwendungen, Lösungen. Technologieprogramm KI-Innovationswettbewerb des Bundesministeriums für Wirtschaft und Energie/Begleitforschung: Iit-Institut für Innovation und Technik in der VDI/VDE Innovation + Technik GmbH.
Zurück zum Zitat Landis, J. R., & Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1), 159–174. Landis, J. R., & Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1), 159–174.
Zurück zum Zitat Lei, Y., Yang, B., Jiang, X., Jia, F., Li, N., & Nandi, A. K. (2020). Applications of machine learning to machine fault diagnosis: A review and roadmap. Mechanical Systems and Signal Processing, 138, 106587. Lei, Y., Yang, B., Jiang, X., Jia, F., Li, N., & Nandi, A. K. (2020). Applications of machine learning to machine fault diagnosis: A review and roadmap. Mechanical Systems and Signal Processing, 138, 106587.
Zurück zum Zitat Liang, D., Song, W., & Thomaz, E. (2020). Characterizing the effect of audio degradation on privacy perception and inference performance in audio-based human activity recognition. In Proceedings of the 22nd International Conference on Human-Computer Interaction with Mobile Devices and Services (MobileHCI). Oldenburg, 5–9 October 2020. Liang, D., Song, W., & Thomaz, E. (2020). Characterizing the effect of audio degradation on privacy perception and inference performance in audio-based human activity recognition. In Proceedings of the 22nd International Conference on Human-Computer Interaction with Mobile Devices and Services (MobileHCI). Oldenburg, 5–9 October 2020.
Zurück zum Zitat Mishra, S., Sturm, B. L., & Dixon, S. (2017). Local interpretable model-agnostic explanations for music content analysis. In Proceedings of the 18th International Society for Music Information Retrieval Conference ISMIR 2017, Suzhou (S. 537–543). Mishra, S., Sturm, B. L., & Dixon, S. (2017). Local interpretable model-agnostic explanations for music content analysis. In Proceedings of the 18th International Society for Music Information Retrieval Conference ISMIR 2017, Suzhou (S. 537–543).
Zurück zum Zitat Mitchell, T. (1997). Machine learning. McGraw-Hill. Mitchell, T. (1997). Machine learning. McGraw-Hill.
Zurück zum Zitat Montavon, G., Binder, A., Lapuschkin, S., Samek, W., & Müller, K.-R. (2019). Layer-Wise relevance propagation: An overview. In W. Samek, G. Montavon, A. Vedaldi, L. K. Hansen, & K.-R. Müller (Hrsg.), Explainable AI: Interpreting, explaining and visualizing deep learning (S. 193–209). Springer International Publishing. https://doi.org/10.1007/978-3-030-28954-6_10. Montavon, G., Binder, A., Lapuschkin, S., Samek, W., & Müller, K.-R. (2019). Layer-Wise relevance propagation: An overview. In W. Samek, G. Montavon, A. Vedaldi, L. K. Hansen, & K.-R. Müller (Hrsg.), Explainable AI: Interpreting, explaining and visualizing deep learning (S. 193–209). Springer International Publishing. https://​doi.​org/​10.​1007/​978-3-030-28954-6_​10.
Zurück zum Zitat Morik, K. (2018). Schlüsseltechnologie Maschinelles Lernen. Digitale Welt, 4, 22–27. Morik, K. (2018). Schlüsseltechnologie Maschinelles Lernen. Digitale Welt, 4, 22–27.
Zurück zum Zitat Müller, M. (2015). Fundamentals of music processing: Audio, analysis, algorithms, applications. Springer. Müller, M. (2015). Fundamentals of music processing: Audio, analysis, algorithms, applications. Springer.
Zurück zum Zitat Mun, S., Park, S., Han, D. K., & Ko, H. (2017). Generative adversarial networks based acoustic scene training set augmentation and selection using SVM hyperplane. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE). Munich, 16–17 November 2017. Mun, S., Park, S., Han, D. K., & Ko, H. (2017). Generative adversarial networks based acoustic scene training set augmentation and selection using SVM hyperplane. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE). Munich, 16–17 November 2017.
Zurück zum Zitat Nikolenko, S. I. (2021). Synthetic data for deep learning. Springer. Nikolenko, S. I. (2021). Synthetic data for deep learning. Springer.
Zurück zum Zitat Papenfuss, C. (2017). Ist prädiktive Instandhaltung die Killer-App für das Industrial Internet of Things? Industrie 4.0 Management, 33, 57–60. Papenfuss, C. (2017). Ist prädiktive Instandhaltung die Killer-App für das Industrial Internet of Things? Industrie 4.0 Management, 33, 57–60.
Zurück zum Zitat Patki, N., Wedge, R, & Veeramachaneni, K. (2016). The synthetic data vault. In Proceedings – 3rd IEEE International Conference on Data Science and Advanced Analytics (DSAA), Montreal (S. 399–410). Patki, N., Wedge, R, & Veeramachaneni, K. (2016). The synthetic data vault. In Proceedings – 3rd IEEE International Conference on Data Science and Advanced Analytics (DSAA), Montreal (S. 399–410).
Zurück zum Zitat Piller, F. T. (2000). Mass customization. Deutscher Universitätsverlag. Piller, F. T. (2000). Mass customization. Deutscher Universitätsverlag.
Zurück zum Zitat Purohit, H., Tanabe, R., Ichige, K., Endo, T., Nikaido, Y., Suefusa, K., & Kawaguchi, Y. (2019). MIMII Dataset: Sound Dataset for Malfunctioning Industrial Machine Investigation and Inspection (public 1.0) [dataset]. Zenodo. https://doi.org/10.5281/zenodo.3384388. Purohit, H., Tanabe, R., Ichige, K., Endo, T., Nikaido, Y., Suefusa, K., & Kawaguchi, Y. (2019). MIMII Dataset: Sound Dataset for Malfunctioning Industrial Machine Investigation and Inspection (public 1.0) [dataset]. Zenodo. https://​doi.​org/​10.​5281/​zenodo.​3384388.
Zurück zum Zitat Rammer, C. (2021). Herausforderungen beim Einsatz von Künstlicher Intelligenz, Ergebnisse einer Befragung von jungen und mittelständischen Unternehmen in Deutschland. Mannheim: Bundesministerium für Wirtschaft und Energie (BMWi). Rammer, C. (2021). Herausforderungen beim Einsatz von Künstlicher Intelligenz, Ergebnisse einer Befragung von jungen und mittelständischen Unternehmen in Deutschland. Mannheim: Bundesministerium für Wirtschaft und Energie (BMWi).
Zurück zum Zitat Reichel, J., & Müller, G. (2018). Betriebliche Instandhaltung. J. Haeffs (Hrsg.). Springer. Reichel, J., & Müller, G. (2018). Betriebliche Instandhaltung. J. Haeffs (Hrsg.). Springer.
Zurück zum Zitat Samek, W., Montavon, G., Lapuschkin, S., Anders, C. J., & Müller, K. R. (2021). Explaining deep neural networks and beyond: A review of methods and applications. In Proceedings of the IEEE, 109(3), 247–278. Samek, W., Montavon, G., Lapuschkin, S., Anders, C. J., & Müller, K. R. (2021). Explaining deep neural networks and beyond: A review of methods and applications. In Proceedings of the IEEE, 109(3), 247–278.
Zurück zum Zitat Seifert, I., Bürger, M., Wangler, L., Christmann-Budian, S., Rohde, M., Gabriel, P., & Zinke, G. (2018). Potenziale der Künstlichen Intelligenz im produzierenden Gewerbe in Deutschland: Studie im Auftrag des Bundesministeriums für Wirtschaft und Energie (BMWi). Berlin. Seifert, I., Bürger, M., Wangler, L., Christmann-Budian, S., Rohde, M., Gabriel, P., & Zinke, G. (2018). Potenziale der Künstlichen Intelligenz im produzierenden Gewerbe in Deutschland: Studie im Auftrag des Bundesministeriums für Wirtschaft und Energie (BMWi). Berlin.
Zurück zum Zitat Sohn, K., Berthelot, D., Li, C.-L., Zhang, Z., Carlini, N., Cubuk, E. D., Kurakin, A., Zhang, H., & Raffel, C. (2020). FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence. http://arxiv.org/abs/2001.07685. Sohn, K., Berthelot, D., Li, C.-L., Zhang, Z., Carlini, N., Cubuk, E. D., Kurakin, A., Zhang, H., & Raffel, C. (2020). FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence. http://​arxiv.​org/​abs/​2001.​07685.
Zurück zum Zitat Stacke, K., Eilertsen, G., Unger, J., & J. & Lundstrom, C. (2021). Measuring domain shift for deep learning in histopathology. IEEE Journal of Biomedical and Health Informatics, 25(2), 325–336. Stacke, K., Eilertsen, G., Unger, J., & J. & Lundstrom, C. (2021). Measuring domain shift for deep learning in histopathology. IEEE Journal of Biomedical and Health Informatics, 25(2), 325–336.
Zurück zum Zitat Stoesser, K. R. (2017). Prozessoptimierung für produzierende Unternehmen. Springer Fachmedien. Stoesser, K. R. (2017). Prozessoptimierung für produzierende Unternehmen. Springer Fachmedien.
Zurück zum Zitat Tercan, H., Guajardo, A., & Meisen, T. (2019). Industrial transfer learning: Boosting machine learning in production. In 2019 IEEE 17th International Conference on Industrial Informatics (INDIN), 274–279. Tercan, H., Guajardo, A., & Meisen, T. (2019). Industrial transfer learning: Boosting machine learning in production. In 2019 IEEE 17th International Conference on Industrial Informatics (INDIN), 274–279.
Zurück zum Zitat Theissler, A., Pérez-Velázquez, J., Kettelgerdes, M., & Elger, G. (2021). Predictive maintenance enabled by machine learning: Use cases and challenges in the automotive industry. Reliability engineering & system safety, 215, 107864. Theissler, A., Pérez-Velázquez, J., Kettelgerdes, M., & Elger, G. (2021). Predictive maintenance enabled by machine learning: Use cases and challenges in the automotive industry. Reliability engineering & system safety, 215, 107864.
Zurück zum Zitat Töpfer, A., & Günther S. (2007). Steigerung des Unternehmenswertes durch Null-Fehler-Qualität als strategisches Ziel: Überblick und Einordnung der Beiträge. In Töpfer A. (Hrsg.), Six Sigma. Springer. Töpfer, A., & Günther S. (2007). Steigerung des Unternehmenswertes durch Null-Fehler-Qualität als strategisches Ziel: Überblick und Einordnung der Beiträge. In Töpfer A. (Hrsg.), Six Sigma. Springer.
Zurück zum Zitat Turian, J., Shier, J., Khan, H., Raj, B., Schuller, B., Steinmetz, C., Malloy, C., Tzanetakis, G., Velarde, G., McNally, K., Henry, M., Pinto, N., Noufi, C., Clough, C., Herremans, D., Fonseca, E., Engel, J., Salamon, J., Esling, P., Manocha, P., Watanabe, S., Jin, Z., & Bisk, Y. (2022). HEAR: Holistic Evaluation of Audio Representations. In Proceedings of Machine Learning Research. Virtual, 13–14 December 2021. Turian, J., Shier, J., Khan, H., Raj, B., Schuller, B., Steinmetz, C., Malloy, C., Tzanetakis, G., Velarde, G., McNally, K., Henry, M., Pinto, N., Noufi, C., Clough, C., Herremans, D., Fonseca, E., Engel, J., Salamon, J., Esling, P., Manocha, P., Watanabe, S., Jin, Z., & Bisk, Y. (2022). HEAR: Holistic Evaluation of Audio Representations. In Proceedings of Machine Learning Research. Virtual, 13–14 December 2021.
Zurück zum Zitat Wang, M., & Deng, W. (2018). Deep visual domain adaptation: A survey. Neurocomputing, 312, 135–153. Wang, M., & Deng, W. (2018). Deep visual domain adaptation: A survey. Neurocomputing, 312, 135–153.
Zurück zum Zitat Wang, Y. S., Liu, N. N., Guo, H., & Wang, X. L. (2020). An engine-fault-diagnosis system based on sound intensity analysis and wavelet packet pre-processing neural network. Engineering Applications of Artificial Intelligence, 94. Wang, Y. S., Liu, N. N., Guo, H., & Wang, X. L. (2020). An engine-fault-diagnosis system based on sound intensity analysis and wavelet packet pre-processing neural network. Engineering Applications of Artificial Intelligence, 94.
Zurück zum Zitat Werner, E. (2009). Wandler für Luftschallmessungen. In M. Möser (Hrsg.), Messtechnik der Akustik (S. 1–53). Springer. Werner, E. (2009). Wandler für Luftschallmessungen. In M. Möser (Hrsg.), Messtechnik der Akustik (S. 1–53). Springer.
Zurück zum Zitat Wong, P. K., Zhong, J., Yang, Z., & Vong, C. M. (2016). Sparse Bayesian extreme learning committee machine for engine simultaneous fault diagnosis. Neurocomputing, 174, 331–343. Wong, P. K., Zhong, J., Yang, Z., & Vong, C. M. (2016). Sparse Bayesian extreme learning committee machine for engine simultaneous fault diagnosis. Neurocomputing, 174, 331–343.
Zurück zum Zitat Yang, Q., Liu, Y., Chen, T., & Tong, Y. (2019). Federated machine learning: Concept and applications. ACM Transactions on Intelligent Systems and Technology (TIST). 10(2), Article No. 12. Yang, Q., Liu, Y., Chen, T., & Tong, Y. (2019). Federated machine learning: Concept and applications. ACM Transactions on Intelligent Systems and Technology (TIST). 10(2), Article No. 12.
Zurück zum Zitat Zapp, T., Jussen, P., & Kurz, M. (2018). Informations- und Kommunikationstechnologien für die Instandhaltungsplanung und -steuerung. In J. Reichel, G. Müller, & J. Haeffs (Hrsg.), Betriebliche Instandhaltung (S. 205–222). Springer. Zapp, T., Jussen, P., & Kurz, M. (2018). Informations- und Kommunikationstechnologien für die Instandhaltungsplanung und -steuerung. In J. Reichel, G. Müller, & J. Haeffs (Hrsg.), Betriebliche Instandhaltung (S. 205–222). Springer.
Metadaten
Titel
KI-basiertes akustisches Monitoring: Herausforderungen und Lösungsansätze für datengetriebene Innovationen auf Basis audiovisueller Analyse
verfasst von
Patrick Aichroth
Judith Liebetrau
Copyright-Jahr
2023
DOI
https://doi.org/10.1007/978-3-658-42060-4_4

Premium Partner