KI-Tools für Text und Bild

ChatGPT kennen heutzutage schon alle. Doch welche Tools arbeiten noch mit Künstlicher Intelligenz (KI), und vor allem, wie? In diesem Blogartikel zeige ich dir einige Möglichkeiten, dich inspirieren zu lassen und/oder wertvolle Zeit einzusparen.

 

AskYourPDF

AskYourPDF ist im Grunde kein eigenes Tool, sondern ein Plugin für ChatGPT. Es wurde dafür entwickelt, das Extrahieren von Informationen aus PDF-Dateien zu erleichtern. AskYourPDF hilft dir, Inhalte eines PDF-Dokuments rasch erfassen zu lassen. Es hat zwei Hauptfunktionen: den Download und die Speicherung eines PDFs, sowie das Abfragen von Informationen aus einem PDF.
Für die erste Funktion lieferst du dem Plugin einen URL-Link zu einem PDF, und es prüft, ob es sich um eine korrekte URL handelt. Danach lädt das Plugin die PDF-Datei herunter und sichert dessen Inhalt in einer Datenbank.
Für die zweite Funktion ruft das Plugin die Datei direkt aus der Datenbank ab. Es durchsucht im Anschluss die gespeicherte Datei, um Antworten auf deine Fragen zu filtern oder Details abzurufen. Die Antworten erhältst du mit einer konkreten Angabe der Seitennummer, auf der du die benötigten Informationen finden kannst.
Kleiner Wermutstropfen: du benötigst die Bezahlversion von ChatGPT, ChatGPT Plus. Da es sich um ein Beta-Feature handelt, musst du «Beta Features» in den Einstellungen aktivieren. Im Store von ChatGPT gibt es zwischenzeitlich zahlreiche Plugins. Nutze also die Suchfunktion «Search plugins» um AskYourPDF zu finden.

Audiopen

Mit Audiopen kannst du Sprachnotizen in Text umwandeln. Die Benutzeroberfläche ist selbsterklärend. Damit du eine Aufnahme starten kannst, klickst du einfach auf das Mikrofon, das sich in der Mitte deines Screens befindet. Somit kannst du eine Sprachnotiz aufnehmen, die automatisch in eine schriftliche Notiz umgewandelt wird, sobald du die Stopp-Taste betätigst. Das File wird automatisch gespeichert. Audiopen unterstützt zahlreiche Sprachen und bietet unterschiedliche Stile an. Du kannst auch alte Notizen importieren und diese wahlweise für E-Mails, Aufsätze oder Aufgabenlisten umschreiben lassen.
Für die Transkription brauchst du eine stabile Internetverbindung, da Audiopen eine Web-Anwendung ist. Die Basisversion von Audiopen ist kostenlos, hat aber einige Einschränkungen. Beispielsweise können Sprachnotizen hier nur bis zu drei Minuten lang sein, und es können nur zehn Notizen parallel kostenlos gespeichert werden. Zahlende Nutzer:innen hingegen können Sprachnotizen bis zu 15 Minuten verarbeiten lassen, die Anzahl der Notizen ist unbegrenzt. Es können pro Monat 30 Audiodateien hochgeladen werden.

Zahlende NutzerInnen

Sie können ausserdem automatisch Zusammenfassungen erstellen lassen und die Länge der Zusammenfassung anpassen. Wer nur gelegentlich Sprachnotizen auf raschem Weg in Text umwandeln möchte, ist mit der kostenfreien Version von Audiopen sicher gut beraten.

Deepl Write

Bestimmt ist dir der Deepl Translator bereits ein Begriff. Doch Deepl hat noch mehr zu bieten: Deepl Write verbessert deine geschriebenen Texte. Dabei richtet sich das Augenmerk nicht nur auf die Grammatik und die Rechtschreibung, sondern es schlägt dir auch alternative Formulierungen für Ton, Stil und Wortwahl vor. Auf Basis eines Wortes oder Satzes kannst du damit aus verschiedenen Formulierungen auswählen und abwechslungsreiche Texte gestalten. Aktuell wird Deepl Write für britisches und amerikanisches Englisch, sowie für Deutsch angeboten. Das Tool ist kostenfrei.

Upscayl

Das Open-Source-Tool Upscayl verbessert mithilfe Künstlicher Intelligenz Bildmaterial. Die Auflösung von Bildern, aber auch Videos, wird erhöht, wobei die Schärfe beibehalten wird. Es entstehen keine Kosten. Upscayl verfügt über eine sehr einfach gehaltene Benutzeroberfläche und beschränkt sich rein auf die Vergrösserungsfunktion. Auch die Bedienung ist relativ einfach: du lädst das Bildmaterial hoch und stellst ein, mit welchem neuralen Netzwerk es vergrössert werden soll. Zur Auswahl steht etwa Ultrasharp, das sich gut für Bilder von Personen, Tieren, Architektur oder Geräten eignet. Für Landschaften, Zeichnungen oder Gemälde empfiehlt sich Remacri. Digitale Kunst oder Cartoons vergrösserst du am besten mit der Variante Digital Art. Wenn du mit dem Ergebnis zufrieden bist und das Resultat abspeichern willst, kannst du ausserdem das gewünschte Dateiformat festlegen. Eine Batch-Funktion ermöglicht dir zudem die Vergrösserung mehrere Bilddateien gleichzeitig.

Synthesia

Mit Synthesia kannst du KI-Videos erstellen. Text wird in gesprochene Sprache umgewandelt, das Video wird entsprechend gesprochen und synchronisiert. Die Videos, die entstehen, werden einerseits computergeneriert, imitieren aber dennoch menschliches Verhalten. Synthesia bietet eine umfassende Datenbank aus KI-Avataren und unterstützt über 100 Sprachen. Es können auch individuelle Avatare erstellt werden. Auch die eigene Stimme kannst du einem individuellen KI-Avatar hinzufügen. Eine weitere nützliche Funktion sind die Untertitel. Damit werden deine Videos auch Personen mit eingeschränktem Hörvermögen zugänglich, oder Leuten, die das Video ohne Ton ansehen möchten – weil sie vielleicht gerade in der Strassenbahn sitzen und die Kopfhörer nicht dabei haben. Mit Synthesia kannst du etwa Videos über dein Produktportfolio oder deine Dienstleistungen erstellen, oder anregende Marketing-Videos für Social Media.
Der Ablauf ist rasch erklärt: Du schreibst ein Skript für dein Video, wählst eine Vorlage und einen Avatar, tippst den Text ein (oder fügst ihn ein), bearbeitest und erstellst dein Video. Es gibt zwei Pläne für die Bezahlung: persönlich oder Unternehmen. Eine kostenfreie Variante steht nicht zur Verfügung.

Adobe Firefly

Diese Software nutzt Künstliche Intelligenz, um Bilder anhand von textlichen Anweisungen zu erstellen. Adobe Firefly unterstützt über 100 Sprachen. Nach der Beta-Phase ist Firefly nun Teil der Adobe Creative Cloud. Nutzer:innen haben darin Zugriff auf vielfältige Funktionen. Diese können zwar auch kostenlos im Web getestet werden, tragen dann jedoch ein Wasserzeichen.
Anhand von textlichen Parametern, die von den User:innen in Alltagssprache eingegeben werden, erzeugt die generative KI Porträts, Fantasiegestalten, Texteffekte oder generative Neufärbung. Je präziser deine Wortwahl, desto besser die Ergebnisse. Objekte können hinzugefügt oder entfernt werden. Der gesamte Schaffensprozess läuft über die Texteingabe. Nimm dir etwas Zeit, um darin in Übung zu kommen.

Midjourney

Ähnlich tickt auch Midjourney. Um dieses Tool nutzen zu können, brauchst du einen Account bei Discord. In den Chaträumen von Discord – im Kanal «Midjourney» – kannst du den kreativen Schaffensprozess starten. Auch hier gibst du dem Tool textliche Anweisungen, wie dein Bild aussehen soll. Inzwischen ist auch Deutsch (unter anderen Sprachen) möglich, die Ergebnisse sind jedoch auf Englisch genauer. Die Eingaben, die du dem Tool lieferst, um dein gewünschtes Bild zu erstellen, werden «Prompts» genannt und müssen mit dem Befehl «/imagine» beginnen. Je genauer die Anweisungen sind, desto besser werden die Resultate. Es gibt ein Handbuch, das über optimale Anweisungen aufklärt. Du kannst auch Bilder hochladen, um Midjourney zu zeigen, in welche Richtung deine Kreation gehen soll. Midjourney eignet sich also auch dafür, Ideen zu entwickeln. Für die Verwendung von Midjourney musst du über den Button «Manage Sub» eines der drei verfügbaren Abos abschliessen.
Die Liste der verfügbaren KI-Tools ist mit diesem Beitrag noch lange nicht ausgeschöpft! Die hier vorgestellten Möglichkeiten sollen dir einen Einblick liefern, wie du KI für deine Arbeit einsetzen kannst – sei es, um dir Ideen und Inspirationen für die Gestaltung zu holen, deine Aufgaben effizienter abzuarbeiten, oder deine Texte zu optimieren.
Ich wünsche dir viel Freude beim Ausprobieren!
Sie suchen professionelle Hilfe für Ihren Wachstum?
Rufen Sie uns an oder kontaktieren sie uns unter:
+41 76 502 53 62

fokussiert & professionell

Höchste Qualität & Know How für Ihre Anliegen und Umsetzungen.
Bestens gerüstet für den digitalen Markt.

Address

Kohlfirststrasse 5

CH-8252 Schlatt

© CREATIONWORX – Martin Schunerits-Grandits