Skip to main content

2023 | OriginalPaper | Buchkapitel

15. Kreativität: Generative Künstliche Intelligenz

verfasst von : Patrick Krauss

Erschienen in: Künstliche Intelligenz und Hirnforschung

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Kreativität bedeutet, etwas zu erschaffen, was neu und nützlich ist. Bending, Blending und Breaking sind drei verschiedene Strategien, um Kreativität zu fördern. Diese Ansätze können bestehende Ideen hinterfragen, verändern und kombinieren, um neue Perspektiven und Innovationen zu schaffen. Deep Dreaming erzeugt Bilder, indem ein vortrainiertes neuronales Netz verwendet wird, um das Eingangsbild zu optimieren. Eine Zielfunktion wird definiert, um die erkannten Muster und Merkmale im Eingabebild zu verändern. Das resultierende Bild enthält verstärkte Muster und Merkmale, die ihm ein einzigartiges, traumähnliches Aussehen verleihen. Beim Style Transfer wird der künstlerische Stil eines Bildes mit dem Inhalt eines anderen Bildes kombiniert, um ein neues Bild zu erzeugen. Hierbei werden Inhalts- und Stilinformationen durch ein vortrainiertes neuronales Netz getrennt und neu kombiniert. Generative Adversarial Networks (GANs) bestehen aus einem Generator- und einem Diskriminator-Netz und werden zur Erzeugung von täuschend echten Bildern oder Videos, sogenannten Deep Fakes, eingesetzt. Der Generator erzeugt neue Kandidatenbilder oder -videos, während der Diskriminator versucht, reale von künstlich erzeugten zu unterscheiden. Im Verlauf des Trainings verbessern sich beide Netze iterativ in ihrer jeweiligen Aufgabe. Diffusionsmodelle können Bilder durch einen Prozess erzeugen, der als Denoising Score Matching bekannt ist. Indem sie lernen, einen simulierten Diffusionsprozess umzukehren, können sie aus Rauschen völlig neue Bilder erzeugen. Sie können auch mit Sprachmodellen kombiniert werden, um aus Textbeschreibungen Bilder zu erzeugen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Batzolis, G., Stanczuk, J., Schönlieb, C. B., & Etmann, C. (2021). Conditional image generation with score-based diffusion models. arXiv preprint arXiv:2111.13606. Batzolis, G., Stanczuk, J., Schönlieb, C. B., & Etmann, C. (2021). Conditional image generation with score-based diffusion models. arXiv preprint arXiv:​2111.​13606.
Zurück zum Zitat Dhariwal, P., & Nichol, A. (2021). Diffusion models beat GANs on image synthesis. Advances in Neural Information Processing Systems, 34, 8780–8794. Dhariwal, P., & Nichol, A. (2021). Diffusion models beat GANs on image synthesis. Advances in Neural Information Processing Systems, 34, 8780–8794.
Zurück zum Zitat Eagleman, D., & Brandt, A. (2017). The runaway species: How human creativity remakes the world. Catapult. Eagleman, D., & Brandt, A. (2017). The runaway species: How human creativity remakes the world. Catapult.
Zurück zum Zitat Foster, D. (2019). Generative deep learning: Teaching machines to paint, write, compose, and play. O'Reilly Media. Foster, D. (2019). Generative deep learning: Teaching machines to paint, write, compose, and play. O'Reilly Media.
Zurück zum Zitat Gatys, L. A., Ecker, A. S., & Bethge, M. (2016). Image style transfer using convolutional neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (S. 2414–2423). Gatys, L. A., Ecker, A. S., & Bethge, M. (2016). Image style transfer using convolutional neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (S. 2414–2423).
Zurück zum Zitat Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63(11), 139–144. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63(11), 139–144.
Zurück zum Zitat Nichol, A., Dhariwal, P., Ramesh, A., Shyam, P., Mishkin, P., McGrew, B., ... & Chen, M. (2021). Glide: Towards photorealistic image generation and editing with text-guided diffusion models. arXiv preprint arXiv:2112.10741. Nichol, A., Dhariwal, P., Ramesh, A., Shyam, P., Mishkin, P., McGrew, B., ... & Chen, M. (2021). Glide: Towards photorealistic image generation and editing with text-guided diffusion models. arXiv preprint arXiv:​2112.​10741.
Zurück zum Zitat Sohl-Dickstein, J., Weiss, E., Maheswaranathan, N., & Ganguli, S. (2015, June). Deep unsupervised learning using nonequilibrium thermodynamics. In International Conference on Machine Learning (S. 2256–2265). PMLR. Sohl-Dickstein, J., Weiss, E., Maheswaranathan, N., & Ganguli, S. (2015, June). Deep unsupervised learning using nonequilibrium thermodynamics. In International Conference on Machine Learning (S. 2256–2265). PMLR.
Zurück zum Zitat Swersky, K., Ranzato, M. A., Buchman, D., Freitas, N. D., & Marlin, B. M. (2011). On autoencoders and score matching for energy based models. In Proceedings of the 28th international conference on machine learning (ICML-11) (S. 1201–1208). Swersky, K., Ranzato, M. A., Buchman, D., Freitas, N. D., & Marlin, B. M. (2011). On autoencoders and score matching for energy based models. In Proceedings of the 28th international conference on machine learning (ICML-11) (S. 1201–1208).
Zurück zum Zitat Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P. A., & Bottou, L. (2010). Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. Journal of Machine Learning Research, 11(12). Vincent, P., Larochelle, H., Lajoie, I., Bengio, Y., Manzagol, P. A., & Bottou, L. (2010). Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. Journal of Machine Learning Research, 11(12).
Zurück zum Zitat Wang, C., Chen, S., Wu, Y., Zhang, Z., Zhou, L., Liu, S., ... & Wei, F. (2023). Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv preprint arXiv:2301.02111. Wang, C., Chen, S., Wu, Y., Zhang, Z., Zhou, L., Liu, S., ... & Wei, F. (2023). Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. arXiv preprint arXiv:​2301.​02111.
Metadaten
Titel
Kreativität: Generative Künstliche Intelligenz
verfasst von
Patrick Krauss
Copyright-Jahr
2023
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-67179-5_15

Premium Partner