DVs scannen

Diskutiere DVs scannen im NVA-LSK Forum im Bereich Einsatz bei; Auch wenn dieses Thema sicher auch an ander Stelle richtig wäre, will ich es doch hier einstellen, weil das Problem in der spezifischen...

n/a

Guest
Auch wenn dieses Thema sicher auch an ander Stelle richtig wäre, will ich es doch hier einstellen, weil das Problem in der spezifischen Kombination von Hardware und NVA-Dokumenten besteht:

Aus der Erfahrung heraus, daß Informationen nur wirklich schnell findbar sind, wenn sie elektronisch verfügbar gemacht werden, habe ich versucht, meinen Bestand an DVs zu scannen. Ich habe einen Einzugsscanner (eigentlich ein Multifunktionsgerät) Brother MFC-7440N, das super in der Lage ist, ganze Stapel von Papier ohne manuellen Eingriff in Pdfs oder Textdateien zu verwandeln. Nur mit den NVA-DVs funktioniert das nicht (oder nur selten), weil die Papierqualität relativ schlecht ist und mein Scanner die Blätter nur mit einer schmalen Gummirolle von ca. 5 cm Breite einzieht, was zur Überlastung des Papiers an dieser Stelle, zerrissenen Seiten und Papierstaus führt.

Hat jemand bessere Erfahrungen mit anderen Geräten gemacht? Kennt jemand Scanner, die über die ganze Papierbreite einziehen?
 
#
Schau mal hier: DVs scannen. Dort wird jeder fündig!

Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
DDA

DDA

Alien
Dabei seit
07.04.2003
Beiträge
6.218
Zustimmungen
18.227
Ort
Berlin
Ja, genau dieses Problem hatte ich auch letztens. Ich hab mich der "A 107/1/159 Triebwerk 25 Beschreibung" angenommen, sie war auf A4- Recyclingpapier mittels des (früher allbekannten) Ormig-Verfahrens abgezogen. Der dazu verwendete Druck/Scan/Fax/Kopierer meldet sich mit
KONICA MINOLTA C364SeriesPS(P)
Dieser hatte, entgegen meiner Befürchtungen, so gut wie gar keine Probleme damit, dieses Papier einzuziehen und er lieferte auch brauchbar lesbare Bildergebnisse. Allerdings hab ich die Seiten im Prinzip als 300x300dpi- Bilder eingescannt und keine Texterkennung darüber laufen lassen. Damit sind die Seiten leider nicht nach Inhalten durchsuchbar.

Einen Ausschnitt hab ich mal angehängt.

Axel
 
Anhang anzeigen
Zuletzt bearbeitet:
DDA

DDA

Alien
Dabei seit
07.04.2003
Beiträge
6.218
Zustimmungen
18.227
Ort
Berlin
...

2. Ich habe gerade dein Beispiel als pdf gespeichert und dann der Texterkennungssoftware
"FreeOCR" (kolo) übergeben. Das Ergebnis scheint recht brauchbar, auf jeden Fall besser,
als alles abzutippen. Eine professionelle OCR-Software liefert da sicher noch bessere Resultate.
Letzteres liegt insbesondere an der nicht installierten OCR- Software auf meiner Debian-Kiste auf der Arbeit. Aber ich werd es mal tesseract probieren...

Axel
 
Hirsch

Hirsch

Flieger-Ass
Dabei seit
01.10.2003
Beiträge
312
Zustimmungen
55
Ort
Ellrich/Thüringen
Aus meiner Sicht kristallisieren sich hier 2 Probleme heraus:
  • Mechanische Probleme beim Einzug
    Liegt am Scanner, wie ja die Schreiber schon richtig bemerkten... erfahrungsgemäß gibt es da trotz identischem Funkltionsprinzip Unterschiede, es ist halt wie mit dem Papiereinzug beim Drucker (funktioniert ja genau so). Richtige Dokumentenscanner oder "große" Einzugsscanner an ordentlichen Multifuntionsgeräten haben die Nase vorn, die laufen besser. Ich abe bei Kunden im kleinen Bereich Canon-Dokumentenscanner, die ziehen eigentlich prima.
    Bei den DVs kommt aber noch ein Grundsatzproblem: die sind schön bündelweise gedruckt und abgeheftet. Heute müht man sich in Druckertreibern, so einen "Broschürendruck" hinzukriegen, hier fällt es uns auf die Füße. Wenn man die Blätter ausheftet, sind sie A4 groß und beinhalten eine Menge darauf gedruckte A5-Seiten. Wenn man es reihenfolglich korrekt scannen wollte, müsste man alles auftrennen (schneiden) und durch den Einzug jagen. Wenn man es scannt, wie es gedruckt ist, hat man beim OCRen viel manuelle Nacharbeit und muss schauen, dass man die Reihenfolge richtig zusammen klickt.
  • OCR für automatische Texterkennung. Ich verwende Abby Finereader und Omnipage. Beides Programme mit professionellem Anspruch, wenn auch nicht übermäßig teuer und gelegentlich als Zugabe zu Geräten zu bekommen. Aus meiner Sicht ist die Erfolgsquote bei Abby besser; aber das Papier und der Druck bleiben ab und an trotzdem katastrophal und hauen da echte Fehler ins Protokoll :-(.
 
schwarzmaier777

schwarzmaier777

Testpilot
Dabei seit
19.03.2007
Beiträge
853
Zustimmungen
466
Ort
südlich Ulm
Ich helfe mir bei der Texterkennung für PDF mit Adobe Acrobat X - das bringt gute Ergebnisse.

Rein theoretisch besteht auch die Möglichkeit, es mit der Digicam abzufotografieren und im .jpg die Belichtung zu ändern/zuschneiden und mit einem hochauflösenden PDF Drucker drucken.

Ist zwar sicher umständlicher, aber wenn`s einmal fotografiert ist .... isses im PC

Gruß
Ingo
 
DDA

DDA

Alien
Dabei seit
07.04.2003
Beiträge
6.218
Zustimmungen
18.227
Ort
Berlin
Ich hab jetzt mal nebenbei einen meiner gescannten Texte durch die
Tesseract Open Source OCR Engine v3.02 with Leptonica
laufen lassen, die Ergebnisse sind eher sehr mittelmäßig, die Rechenzeiten hingegen beträchtlich (fast 12 Stunden für die seitenweise Abarbeitung der ca 230 Seiten, allerdings auf einem i3).
Hier ist das (unkorrigierte) Ergebnis des Ausschnittes, den ich schon mal als Bild eingebunden habe
1-iietdietreä

ni„1.A1lgeeeinee

äDer Verdiehter fißiid i} dient zum Komprimieren der Umgebungew

luft und deren Eutühreng zur Heuptbrennkemeeri
Der Verdichter des Triebwerkes ist ein Eetufiger Axielverdiehm
ter mit 2 Rotoren, Er beeteht aus dem steter mit den eterren_

Schaufeln der Leitapperetea dem hinteren Gehäuse sowie 2 Rom

raren: dem Setufigeeemiederdruekrotor und dem Satufigen Hechu
druekreter„ V ’


Eventuell würde eine höhere Auflösung als 300x300 dpi beim Scannen noch eine Verbesserung bringen, aber viel wird dies auch nicht mehr helfen. Allerdings ist die Vorlage, die mir zur Verfügung stand auch längst nicht auf allen Seiten wirklich kontrastreich und gut. Vielleicht hilft auch noch ein wenig Bildverbesserung...
Leider scheint aber im Linux-Umfeld die OCR- Geschichte ein eher stiefmütterlich behandeltes Problem zu sein.

Axel
 

Xena

inaktiv
Dabei seit
04.11.2010
Beiträge
2.319
Zustimmungen
110
Ort
Schwäbisches Meer
Ich kann da Finereader wärmstens empfehlen. Allerdings eine Version vor der V.10. Ab der V.10 wird ein neues Dateiformat verwendet das x mal mehr Plattenspeicher benötigt als frühere Versionen. Ich habe die V.7 und die ist absolut top und hat eine sehr geringe Fehlerquote und man bekommt es für wenig Geld. Man sollte aber für eine hohe Erkennungsrate auch mit 300DPI aufwärts arbeiten, je nach Vorlage und Schriftgröße. Etwas Nacharbeit ist aber immer drin.

Daß OCR unter Linux, also als open source, so stiefmütterlich behandelt wird hängt davon ab, weil hinter einem OCR eine komplexe mathematische Algorythmen stehen, die für viel Geld gehandelt werden. Da kommt in der Leistung kein open source mehr mit, außer ein Genie gibt seine Algorythmen für mau heraus.
 
victoralert

victoralert

inaktiv
Dabei seit
13.08.2010
Beiträge
297
Zustimmungen
13
Bei den DVs kommt aber noch ein Grundsatzproblem: die sind schön bündelweise gedruckt und abgeheftet. Wenn man die Blätter ausheftet, sind sie A4 groß und beinhalten eine Menge darauf gedruckte A5-Seiten. Wenn man es reihenfolglich korrekt scannen wollte, müsste man alles auftrennen (schneiden) und durch den Einzug jagen. Wenn man es scannt, wie es gedruckt ist, hat man beim OCRen viel manuelle Nacharbeit und muss schauen, dass man die Reihenfolge richtig zusammen klickt.
Gibt es dafür irgendeine sinnvolle Lösung?
Manche scannen ihre Bücher (Zweitexemplare), zuvor wurde der Buchrücken geradezu vergewaltigend abgeschnitten. Das jeweilige Buch kann man aber dann als solches nicht mehr wirklich nutzen. Man könnte das bei den DV genau so machen, falls der Schnitt nicht zu dicht an der Lochung sitzt. Damit ließe sich eine Reihenfolge beim scannen ereichen. Aber wenn die Seiten beidseitig bedruckt sind?
 
DDA

DDA

Alien
Dabei seit
07.04.2003
Beiträge
6.218
Zustimmungen
18.227
Ort
Berlin
Viele DV sind normal gelochte, einzelne A-4 Blätter, die in einer mit zwei Schaubverbingungen zusammengefaßten Hülle stecken. Diese könnte man für einen Scan demontieren (nicht die kleinen Schräublein verlieren - wäre mir letztens beinahe passiert, auf grauem Teppich sind die echt schwierig wieder zu finden :FFTeufel:).Die Einzelbätter kann der Dokumenteneinzug samt Duplexer eines "größeren" Multifunktionsgerätes relativ mühelos verarbeiten.
Das Gerät, welches ich verwendet habe, bietet zusätzlich die Möglichkeit zum "selbst umblättern", so daß man ein Buch auch seitenweise einscannen und in eine Datei ablegen kann. Das Problem mit der Bindung am Buchrücken ist allerdings damit nicht behebbar.

Axel
 
Hirsch

Hirsch

Flieger-Ass
Dabei seit
01.10.2003
Beiträge
312
Zustimmungen
55
Ort
Ellrich/Thüringen
...(nicht die kleinen Schräublein verlieren - wäre mir letztens beinahe passiert, auf grauem Teppich sind die echt schwierig wieder zu finden :FFTeufel:).
Axel
OT: Staubsauger nehmen und bedienen, bis es im Behälter klappert. Dann weißt Du wenigstens, wo die Schraube ist :HOT:
 
Thema:

DVs scannen

DVs scannen - Ähnliche Themen

  • Frühe Ju 52/3m bei DVS

    Frühe Ju 52/3m bei DVS: Für zwei frühe Ju 52/3m wird in verschiedenen Quellen berichtet: - WNr. 4031 "Ju 52/3m fe" D-2759 an DVS 11.1933 - WNr. 4032 "Ju 52/3m fe"...
  • Suche Tipps: Dias scannen und bearbeiten

    Suche Tipps: Dias scannen und bearbeiten: Hallo Kann man ein Dia oder normales Foto irgendwie in digitaler Form Zu Hause herstellen und wie? Bräuchte eine FREIES Programm zum...
  • Fotos einscannen für FF

    Fotos einscannen für FF: Kann jemand eine Kurzanleitung geben, wie man vorgehen muss um Fotos (Abzüge 10x15 cm oder Dias) optimal einzuscannen für FF? Die leiden immer...
  • Ähnliche Themen

    • Frühe Ju 52/3m bei DVS

      Frühe Ju 52/3m bei DVS: Für zwei frühe Ju 52/3m wird in verschiedenen Quellen berichtet: - WNr. 4031 "Ju 52/3m fe" D-2759 an DVS 11.1933 - WNr. 4032 "Ju 52/3m fe"...
    • Suche Tipps: Dias scannen und bearbeiten

      Suche Tipps: Dias scannen und bearbeiten: Hallo Kann man ein Dia oder normales Foto irgendwie in digitaler Form Zu Hause herstellen und wie? Bräuchte eine FREIES Programm zum...
    • Fotos einscannen für FF

      Fotos einscannen für FF: Kann jemand eine Kurzanleitung geben, wie man vorgehen muss um Fotos (Abzüge 10x15 cm oder Dias) optimal einzuscannen für FF? Die leiden immer...
    Oben