Texterkennung

  • Android: PDF-Scanner ohne Kosten und Konten – von Microsoft

    Normalerweise, wenn ich Android-Apps empfehle, handelt es sich um Open-Source-Software aus dem F-Droid-Store. Heute ist es regelrecht das Gegenteil: Eine Microsoft-App, nämlich den PDF-Scanner Lens. Und das aus einigen guten Gründen.Weiterlesen »

  • Windows: Text per Open-Source-Tool aus Fotos kopieren

    Text aus Fotos kopieren ist nicht nur im Blogger-Alltag praktisch! Ich nutze die Funktion auf dem iPhone oder meinem MacBook fast täglich, um beispielsweise Telefonnummern zu sichern und mehr. Dank der hervorragenden Microsoft-Toolsammlung PowerToys könnt Ihr nun auch unter Windows mit minimalem Aufwand OCR auf Fotos oder Screenshots anwenden und den Text in eine andere Anwendung kopieren. Möglich macht es ein neues Tool, das in Version 0.62 zu den PowerToys hinzugestoßen ist.

    PowerToys-Textextraktor kopiert Text aus Bildern

    Mit dem Update auf PowerToys Version 0.62, das Ihr wie immer via GitHub herunterladen könnt, bekommt Ihr über den neuen Textextraktor die Möglichkeit, Texte aus Fotos zu kopieren. Das funktioniert ähnlich wie das Mac-OCR-Tool Trex, das wir Euch hier vorstellen: Per Tastenkombination (standardmäßig Windows-Taste + Shift + T) erstellt Ihr einen Quasi-Screenshot. Der darin enthaltene Text landet in der Zwischenablage von Windows. Von hier kopiert Ihr ihn einfach in eine andere Anwendung, etwa den Texteditor.

    Text aus Bildern extrahieren Windows
    Praktisch ist der Textextraktor unter anderem, wenn Ihr Texte aus Bildschirmfotos kopieren möchtet.

    Die Texterkennung funktioniert nach meinen Tests recht gut, wenn auch nicht ganz so toll, wie es die Fotos-App am Mac hinbekommt. So extrahiert das Tool vor saubere Druckschrift problemlos, mit Handschrift oder anderen Schnörkelschriften hat es aber etwas Probleme.

    Textextraktor Tastenkombination einstellen
    Die Tastenkombination für das kostenlose OCR-Tool könnt Ihr in den PowerToys-Einstellungen anpassen.

    Laut Microsoft-Entwicklern basiert der neue Gratis-OCR-Textextraktor der PowerToys übrigens auf dem ebenfalls quelloffenen TextGrab, das Ihr Euch als Alternative ebenfalls einmal anschauen könnt.

    PowerToys lernen ständig dazu

    Wie schon im etwas älteren Tuto zu den Microsoft PowerToys beschrieben lohnt es sich, die Werkzeugsammlung im Auge zu behalten. Microsoft bleibt hier tatsächlich dran und erweitert die Sammlung laufend um neue Funktionen.

    So gibt es mittlerweile unter anderem einen Auto-Updater für die PowerToys, eine Reihe neuer Werkzeuge wie der Text-Extraktor oder auch ein praktisches Bildschirmlineal sind hinzugekommen, die vorhandenen PowerToys bekommen neue Funktionen und sogar die lange Zeit verbuggte Sicherheitsfunktion für Webcam-Konferenzen funktioniert mittlerweile stabil. Ach ja: Auch eine Version für Windows-on-ARM gibt es mittlerweile von PowerToys, von mir getestet in Windows 11 auf einem M1-MacBook. Sehr schön.

    Microsoft PowerToys neue Funktionen
    Neue Funktionen wie die Spotlight-Alternative PowerToys Run machen die PowerToys zunehmend interessanter.

    Was sagt Ihr eigentlich zu den PowerToys? Ich finde die Sammlung mittlerweile wirklich solide und packe sie mir auf jede Windows-Installation, die ich so betreibe – fairerweise sind das als Mac-Mensch nicht mehr wirklich viele ;-) Sagt doch mal in den Kommentaren, ob Ihr die Dinger auch so praktisch findet wie ich.

    Noch mehr rund um Windows findet Ihr hier, noch mehr aus der wunderbaren Welt der quelloffenen Software sammeln wir hier für Euch.

  • iOS 15: Text mit Live Text aus Fotos kopieren

    Apple arbeitet derzeit an iOS 15 und iPadOS 15. Schon jetzt stehen die neue Systeme als öffentliche Beta zur Verfügung und können von den Todesmutigen unter Euch ausprobiert werden. Zu den wohl interessantesten neuen Funktionen in iOS 15 zählt Live Text. Dahinter verbirgt sich die Möglichkeit, Texte direkt aus Fotos herauszukopieren. So könnt Ihr beispielsweise Telefonnummer, Links, Mailadressen und mehr ganz einfach aus einem Foto übernehmen. Wie das geht und was Ihr dabei beachten müsst? Verraten wir Euch!

    Text aus Fotos kopieren: Nur auf neuen iPhones und iPads

    Bevor es losgeht zunächst eine eher schlechte Nachricht: Die Möglichkeit, Text in Fotos zu markieren und zu kopieren, wird nicht auf allen iPhones und iPads funktionieren, die das Update auf iOS 15 bzw. iPadOS 15 bekommen. Tatsächlich greift Apple dazu auf die hauseigene Neural Engine zurück und setzt ein iPhone bzw. iPad mit leistungsstarkem Bionic-Co-Prozessor voraus. Es muss mindestens der Apple A12 Bionic werkeln, der ab dem iPhone XS zum Einsatz kommt. Der im iPhone X und iPhone 8 verbaute A11 Bionic bietet zwar auch schon Funktionen der Neural Engine, ist aber scheinbar zu schwach auf der Brust, um die Texterkennung zu gewährleisten. Schade, schaffen Apps wie Textgrabber doch auch auf älteren iPhones eine gute OCR-Texterkennung. Tjoa.

    Apple iPhone X
    Vier Jahre nach dem Release fällt das iPhone X erstmals aus einem Feature-Update raus. (Bild: Tutonaut.de)

    Das in iOS 15 integrierte Live Text wird also in den Folgenden iPhones und iPads verfügbar sein:

    • iPhone Xr
    • iPhone XS
    • iPhone 11 / iPhone 11 Pro
    • iPhone 12 / iPhone 12 Pro
    • iPad (ab 2020)
    • iPad Mini (ab 2019)
    • iPad Air (ab 2019)
    • iPad Pro (ab 2018)

    Noch deftiger wird der Cut übrigens bei den Macs sein, die die Funktion grundsätzlich auch erhalten werden. Lediglich die neuen Apple-Silicon-Macs mit dem Apple-M1-Chipsatz oder dessen potenziellen Nachfolgern bekommen Zugriff auf die Neuerung. Für Intel-Nutzer kein Grund zur Trauer, leistet das hervorragende TRex doch bereits jetzt einen ausgezeichneten Job bei der Texterkennung auf Fotos.

    39% sparen
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
    13% sparen
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)

    So kopiert Ihr mit Live Text aus Fotos

    Ist Euer iPhone oder iPad dabei, ist die Nutzung der neuen Texterkennung in iOS 15 ein Kinderspiel. Sie ist direkt in die Fotos-App integriert und funktioniert nicht nur mit gedrucktem, sondern sogar mit handgeschriebenem Text – bei letzterem naturgemäß nicht ganz so zuverlässig. Fotografiert Ihr also beispielsweise ein Whiteboard ab, könnt Ihr im Idealfall die darauf geschriebenen Inhalte gleich herauskopieren.

    Schon in der Betaversion funktioniert die Erkennung von „verschnörkelter“ Schrift erstaunlich gut.

    Öffnet einfach ein Foto und haltet den gewünschten Text für einen Moment gedrückt – ganz so, wie Ihr es aus der normalen Textbearbeitung unter iOS kennt. Wenn Euer iPhone oder iPad den Text erkennt, könnt Ihr ihn nun einfach markieren und erhaltet anschließend die Möglichkeit, ihn zu kopieren, online zu suchen etc.

    Eine zweite Möglichkeit, den Text auf einem Bild zu erkennen, ist der Live-Text-Button, der unten rechts eingeblendet wird. Tippt Ihr diesen an, hebt die Fotos-App sämtliche erkannten Textstellen optisch hervor. Das funktioniert grundsätzlich gut, allerdings erschien die Schaltfläche bei meinen Tests nicht auf allen Fotos mit Textinhalten – das dürfte aber an der frühen Betaphase liegen und wird mit der Zeit hoffentlich noch besser.

    iOS_15_Live_Text_Button
    Über diese Schaltfläche könnt Ihr die Textstellen hervorheben, die iOS 15 erkannt hat. Zumindest in der ersten öffentlichen Betaversion klappt das aber noch nicht ganz zuverlässig.

    Alles in allem bin ich trotz kleinerer Macken beeindruckt davon, wie gut Live Text auf dem iPhone bereits jetzt funktioniert. Laut WWDC-Demo soll die Funktion übrigens auch direkt in die Kamera-App integriert sein und schon beim Knipsen eine Texterkennung anbieten. Zumindest auf meinem Test-iPhone-12-Pro-Max mit der ersten iOS-15-Beta funktionierte das aber noch nicht. Ich bin gespannt, wie sich das ganze bis zum Release von iOS 15 und iPad OS 15 im Herbst noch entwickelt.

    Noch mehr Tipps und Tricks rund um alles mit einem kleinen „i“ im Namen findet Ihr hier, allgemeine Hardware-Tutos aller Art sammeln wir hingegen hier für Euch.

    9% sparen
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
    8% sparen
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
  • Mac: Open-Source-Texterkennung auf Fotos und mehr

    Die Texterkennung aus Fotos oder gescannten Dokumenten ist eine der wichtigsten Funktionen der Digitalisierung. Ob Ihr nun ein Dokument scannen oder den Text auf einem Foto extrahieren wollt, mit Optical Character Recognition oder kurz OCR wird der Job deutlich einfacher. Ein praktisches Open-Source-Tool erlaubt es Euch, am Mac ganz einfach Texte aus Fotos, PDFs oder beliebigen anderen Inhalten zu extrahieren: Ihr erstellt einfach einen Screenshot und der Text landet direkt in der Zwischenablage.

    TRex: Instant-OCR per Screenshot-Funktion

    Das praktische Open-Source-Programm TRex habe ich schon nach wenigen Minuten der Nutzung in mein Herz geschlossen. Die Idee dahinter: Ihr erstellt einen Screenshot von Textinhalten, aus dem TRex dann via OCR den Text erkennt und in die Mac-Zwischenablage kopiert.

    Beachtet, dass Ihr Trex beim ersten Start die Bildschirmaufnahme unter macOS erlauben müsst.

    Anwendungsfälle gibt es eine Menge: Habt Ihr beispielsweise eine Telefonnummer abfotografiert, könnt Ihr diese mit TRex anz einfach aus dem Bild kopieren. Auch PDF-Dokumente ohne eingebetteten Text könnt Ihr mit dem Tool via OCR durchsuchen. Ich als Tech-Blogger-Tünnes werde das Ding vermutlich in Zukunft häufiger verwenden, um Texte aus Screenshots rauszukopieren. Alles in allem sehr nett und sehr zuverlässig.

    Telefonnummern aus Fotos kopieren wird mit TRex deutlich komfortabler.

    Die Funktionsweise von TRex ist supersimpel: Nach dem Start nistet sich das Tool in der Menüleiste von macOS ein. Hier sollet Ihr zunächst auf Preferences klicken und die Erkennungssprache einstellen, etwa auf Deutsch. Hier dürft Ihr bei Bedarf auch direkt einen Tastatur-Befehl zum Aufruf der Screenshot-Funktion vergeben.

    Klickt anschließend auf Capture Text under erstellt ein Bildschirmfoto von dem Textinhalt, den Ihr via OCR erkennbar machen wollt. TRex kopiert den erkannten Text nun automatisch in die Zwischenablage von macOS. Das Ergebnis könnt Ihr nun einfach in einen Texteditor oder ein anderes Dokument kopieren. Ach so: Trex bietet außerdem die Möglichkeit, den Text aus QR-Codes auszulesen. Sehr nett.

    Text aus Screenshots extrahieren ist nicht nur für Tech-Blogger praktisch.

    Kostenlos bei GitHub oder für nen Fünfer im Store

    Übrigens: Wie schon erwähnt und verlinkt ist TRex Open-Source-Software und als solche komplett kostenlos bei GitHub verfügbar. Falls Ihr aber feststellt, dass Ihr das Tool so richtig gerne verwendet, könnt Ihr die Entwicklung auch monetär unterstützen. Dazu kauft Ihr das Programm einfach für 5,49 im Mac App Store – ganz ohne In-App-Käufe, Abos und den ganzen Driss. Ist meiner Meinung nach ein sehr fairer Deal.

    Trex OCR App Store
    Wenn Euch das Programm gefällt, unterstützt die Macher per Kauf im App Store.

    Fun Fact: Auf der erstaunlich drögen WWDC 2021 hat Apple eine Bild-Texterkennung für iOS 15 sowie macOS 12 Monterey angekündigt, die Euch Texte direkt aus Fotos herauskopieren lässt. Zumindest am Mac wird das aber nach aktuellem Stand nur den neuen Apple-Silicon-Macs vorbehalten sein. TRex zeigt, dass diese Magie auf wundersame Weise auch auf der ollen Intel-Hardware wirkt ;-) Allerdings benötigt TRex mindestens macOS Big Sur, auf älteren Systemen funktioniert das Programm nicht.

    Noch mehr Tipps und Tricks rund um macOS findet Ihr hier, Allgemeines rund um das wunderbare Thema Open Source sammeln wir laufend aktuell unter diesem Link für Euch. Ach so, als Basis für unser demonstrierendes Einstiegsbild diente ein Bild von Alexas Fotos auf Pexels.

    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
    11% sparen
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
    (* = Affiliate-Link / Bildquelle: Amazon-Partnerprogramm)
  • Dokumente mit dem iPhone scannen – mit Texterkennung

    Davon hätte James Bond mit seiner Minox geträumt: Mit dem Android-Smartphone hält inzwischen jeder eine vollwertige Kamera in den Händen, die auch als Dokumentscanner verwendet werden kann. Natürlich geht das auch mit dem iPhone oder iPad: Das simple Scannen von Dokumenten ist ja letztlich nichts weiter als Abfotografieren. Richtig spannend wird es erst, wenn der Text direkt mittels Texterkennung (OCR) digitalisiert wird.Weiterlesen »

  • Android: Dokumente mit Texterkennung scannen

    Mit einem Smartphone habt Ihr bereits den perfekten Dokumenten-Scanner: Über ein Foto könnt Ihr nicht nur saubere PDFs erstellen, sondern auch den gesamten Text per OCR erkennen lassen. So lassen sich die Dokumente zum einen durchsuchen und zum anderen Inhalte platzsparend als reiner Text speichern. Und erfreulicherweise geht das ganz ohne Kosten oder Werbung.Weiterlesen »

  • OCR Texterkennung nachträglich in PDF einfügen

    Wenn man ein Dokument scannt, gibt es dabei in aller Regel ein Problem: Das PDF ist zwar eine PDF-Datei, allerdings verhält diese sich eher wie ein Bild! Der enthaltene Text lässt sich nicht durchsuchen. Das Aufspüren bestimmter Dateien mit einer Desktop-Suche wie Siri, Spotlight oder Cortana wird so zur höllischen Aufgabe. Das muss nicht sein: Fügt doch einfach nachträglich eine OCR-Texterkennung ein.Weiterlesen »

Schaltfläche "Zurück zum Anfang"