nach oben

Erschienen in:

2023 | OriginalPaper | Buchkapitel

15. Kreativität: Generative Künstliche Intelligenz

verfasst von : Patrick Krauss

Erschienen in: Künstliche Intelligenz und Hirnforschung

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

Kreativität bedeutet, etwas zu erschaffen, was neu und nützlich ist. Bending, Blending und Breaking sind drei verschiedene Strategien, um Kreativität zu fördern. Diese Ansätze können bestehende Ideen hinterfragen, verändern und kombinieren, um neue Perspektiven und Innovationen zu schaffen. Deep Dreaming erzeugt Bilder, indem ein vortrainiertes neuronales Netz verwendet wird, um das Eingangsbild zu optimieren. Eine Zielfunktion wird definiert, um die erkannten Muster und Merkmale im Eingabebild zu verändern. Das resultierende Bild enthält verstärkte Muster und Merkmale, die ihm ein einzigartiges, traumähnliches Aussehen verleihen. Beim Style Transfer wird der künstlerische Stil eines Bildes mit dem Inhalt eines anderen Bildes kombiniert, um ein neues Bild zu erzeugen. Hierbei werden Inhalts- und Stilinformationen durch ein vortrainiertes neuronales Netz getrennt und neu kombiniert. Generative Adversarial Networks (GANs) bestehen aus einem Generator- und einem Diskriminator-Netz und werden zur Erzeugung von täuschend echten Bildern oder Videos, sogenannten Deep Fakes, eingesetzt. Der Generator erzeugt neue Kandidatenbilder oder -videos, während der Diskriminator versucht, reale von künstlich erzeugten zu unterscheiden. Im Verlauf des Trainings verbessern sich beide Netze iterativ in ihrer jeweiligen Aufgabe. Diffusionsmodelle können Bilder durch einen Prozess erzeugen, der als Denoising Score Matching bekannt ist. Indem sie lernen, einen simulierten Diffusionsprozess umzukehren, können sie aus Rauschen völlig neue Bilder erzeugen. Sie können auch mit Sprachmodellen kombiniert werden, um aus Textbeschreibungen Bilder zu erzeugen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Rekurrente neuronale Netze

Nächstes Kapitel Sprachbegabte KI: ChatGPT und Co.

https://openai.com/product/dall-E-2

https://stablediffusionweb.com/

https://github.com/CompVis/stable-diffusion

https://www.midjourney.com.

https://vall-e.io/

Batzolis, G., Stanczuk, J., Schönlieb, C. B., & Etmann, C. (2021). Conditional image generation with score-based diffusion models. arXiv preprint arXiv:2111.13606.

Dhariwal, P., & Nichol, A. (2021). Diffusion models beat GANs on image synthesis. Advances in Neural Information Processing Systems, 34, 8780–8794.

Eagleman, D., & Brandt, A. (2017). The runaway species: How human creativity remakes the world. Catapult.

Foster, D. (2019). Generative deep learning: Teaching machines to paint, write, compose, and play. O'Reilly Media.

Gatys, L. A., Ecker, A. S., & Bethge, M. (2015). A neural algorithm of artistic style. arXiv preprint arXiv:1508.06576.

Gatys, L. A., Ecker, A. S., & Bethge, M. (2016). Image style transfer using convolutional neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (S. 2414–2423).

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63(11), 139–144.

Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going deeper into neural networks. Google Research Blog. https://research.google/pubs/pub45507

Nichol, A., Dhariwal, P., Ramesh, A., Shyam, P., Mishkin, P., McGrew, B., ... & Chen, M. (2021). Glide: Towards photorealistic image generation and editing with text-guided diffusion models. arXiv preprint arXiv:2112.10741.

Sohl-Dickstein, J., Weiss, E., Maheswaranathan, N., & Ganguli, S. (2015, June). Deep unsupervised learning using nonequilibrium thermodynamics. In International Conference on Machine Learning (S. 2256–2265). PMLR.

Swersky, K., Ranzato, M. A., Buchman, D., Freitas, N. D., & Marlin, B. M. (2011). On autoencoders and score matching for energy based models. In Proceedings of the 28th international conference on machine learning (ICML-11) (S. 1201–1208).

Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P. A., & Bottou, L. (2010). Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. Journal of Machine Learning Research, 11(12).

Wang, C., Chen, S., Wu, Y., Zhang, Z., Zhou, L., Liu, S., ... & Wei, F. (2023). Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv preprint arXiv:2301.02111.

Titel: Kreativität: Generative Künstliche Intelligenz
verfasst von: Patrick Krauss
Verlag: Springer Berlin Heidelberg
Buch: Künstliche Intelligenz und Hirnforschung
Print ISBN: 978-3-662-67178-8

Electronic ISBN: 978-3-662-67179-5

Copyright-Jahr: 2023
DOI: https://doi.org/10.1007/978-3-662-67179-5_15

Springer Professional

Zusammenfassung

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Premium Partner