Gepostet 9 April 2022

Dokumentenmanagementsystem für Privat

Hallo zusammen,

habe viele Dokumenten in ca. 10 Ordnern eingesammelt und es ist leider nun zu undurchsichtig geworden um ein bestimmtes Blatt zu suchen. Daher möchte ich ein DMS aufbauen. Einen halbwegs guten Scanner für den Anfang habe ich (Epson Workforce mit Doppelscan). Später werde ich mir einen Fujitsu ix1500 holen.

Gedacht habe ich Paperless-ng als SW zu nehmen. Was ich gelesen habe ist, dass man Paperless in Docker Container auf Linux installieren muss. Dazu habe ich Frage: Würde ein Raspi Zero 2W reichen (für PiHole und Paperless, sonst nix)? Was müßte ich noch beachten? Muss ich eine SSD an Raspi hängen?

PS: Ich habe nicht viel Ahnung von Linux (die allgemeinen Befehle usw. kenne ich)

Vielen Dank.
Zusätzliche Info
Sag was dazu

Kategorien

33 Kommentare

sortiert nach
's Profilbild
  1. therealpink's Profilbild
    Im Privatbereich reicht imho eine brauchbare Verschlagwortung und Chronologisierung über den Dateinamen plus Volltextsuche in den PDFs.
    Alles andere ist eigentlich zuviel Aufwand.
    Beispiel: 2022_04_09_Doppeldildo_Dildoking_steuerrelevant.pdf
  2. Produkttester's Profilbild
    HaPe4510.04.2022 06:33

    Wo gibst du denn den Doppeldildo bei der Steuererklärung an? …Wo gibst du denn den Doppeldildo bei der Steuererklärung an? Werbungskosten/Arbeitsmittel? Frage fürn Freund ...


    Außergewöhnliche Belastungen
  3. fberndt's Profilbild
    Bite nimm paperless ngx. ng wird nicht mehr weiterentwickelt.
    github.com/pap…ngx
    Paperless stellt ein Webinterface, über das man seine Dokumente im Browser verwalten kann. Eine App gibt es auch noch. Die Dateinamen können frei gewählt werden, sodass auch eine Suche über den Dateiexplorer möglich ist. Die Verschlagwortung geht halbwegs automatisch, wenn man es mal eingestellt hat.
    OCR wird automatisch durchgeführt. Nicht jedes PDF enthält von Haus aus durchsuchbaren Text. Deshalb muss es auch ein etwas stärkerer Pi sein. (bearbeitet)
  4. DrStrangelove89's Profilbild
    Spricht denn etwas gegen die fileee? Die kostenlose Variante sollte ja privat ausreichen. Docker und RAID hört sich nach viel Aufwand an...
  5. HaPe45's Profilbild
    therealpink09.04.2022 22:44

    2022_04_09_Doppeldildo_Dildoking_steuerrelevant.pdf


    Wo gibst du denn den Doppeldildo bei der Steuererklärung an? Werbungskosten/Arbeitsmittel? Frage fürn Freund ...
  6. GelöschterUser1691984's Profilbild
    siedenburgg10.04.2022 02:12

    Da du dort vermutlich wichtige dokumente speichern willst solltest du …Da du dort vermutlich wichtige dokumente speichern willst solltest du nicht einfach eine festplatte oder eine sd karte nehmen.Da sollte man schon über RAID nachdenken und evtl auch über ein zusätzliches Backup in "die Cloud". Paperless an sich ist da schon ganz nett, wenn du jedoch derzeit nicht als Netzwerkspeicher hast dann kannst du dir auch direkt eine gescheite NAS holen, dort 2 Festplatten einstecken und auf der NAS paperless über Docker laufen lassen.Grade am Anfang ist das alles recht viel arbeit bis es läuft und man ist erst überfordert, aber nach und nach kommt man damit besser zurecht.Den Pi kannst du dir dann btw sparen, die sind derzeit eh unverschämt teuer.


    Ein RAID ist dafür nicht nötig. Das braucht man nur, wenn man keine Zeit hat, darauf zu warten, bis das Backup zurückgespielt ist.
    Auch ein NAS ist vollkommen unnötig.
    Einzig mehrere verteilte Backups braucht man.
  7. therealpink's Profilbild
    Naja der Scanvorgang ist ja unabhängig von der Speicherung. Dokumente wirst du immer manuell zusammenlegen und klassifizieren/indizieren müssen. Das im Privatbereich zu automatisieren ist ein unvorstellbarer Aufwand. Das sind ganze Abteilungen und Millionen an externen Kosten involviert im Businessbereich.
    Der Einzugsscanner lohnt sich auf jeden Fall, die Dinger sind super.
  8. Badwek's Profilbild
    Einfach alles einscannen und auf OneDrive tuen. Grund: OneDrive übernimmt OCR Erkennung auf allen Dokumenten und Bildern. Du musst also nichts machen. Ich selbst habe SnapScan benutzt, um alle Dokument einzuscannen.
  9. GelöschterUser1647917's Profilbild
    Dafür gibt es unendlich viele gute Anleitungen im Internet. Woran genau hakt es denn?

    Einen Zero würde ich dafür nicht nehmen.
  10. siedenburgg's Profilbild
    Da du dort vermutlich wichtige dokumente speichern willst solltest du nicht einfach eine festplatte oder eine sd karte nehmen.
    Da sollte man schon über RAID nachdenken und evtl auch über ein zusätzliches Backup in "die Cloud". Paperless an sich ist da schon ganz nett, wenn du jedoch derzeit nicht als Netzwerkspeicher hast dann kannst du dir auch direkt eine gescheite NAS holen, dort 2 Festplatten einstecken und auf der NAS paperless über Docker laufen lassen.
    Grade am Anfang ist das alles recht viel arbeit bis es läuft und man ist erst überfordert, aber nach und nach kommt man damit besser zurecht.
    Den Pi kannst du dir dann btw sparen, die sind derzeit eh unverschämt teuer.
  11. LordLord's Profilbild
    Ich habe eine Zeitlang Paperless betrieben, für mich im Privatgebrauch übertrieben.
    Eine ordentliche Benennung der Dokumente sollte trotzdem vorgenommen werden, ebenso eine entsprechende Ordnerstruktur. Wenn der Scanner/Software OCR kann, ist das alles schon erledigt.
  12. 2000flash2000's Profilbild


    Ich habe die letzten Monate mich ebenfalls mit der Thematik auseinander gesetzt und bin zum Schluss bei PaperOffice gelandet. Ist aus meiner Sicht die genialste Software, die es gibt und dazu noch (in der Grundversion, die aber ausreicht) kostenfrei.

    Kurzanleitung zur Installation ist u.a. hier zu finden:
  13. Gudder's Profilbild
    Autor*in
    Mein Favorit ist Paperless-ng. Ich habe einige Anleitungen durchgelesen, irgendwie sind die nicht so geeignet für einen Anfänger wie mich.
    Ich nehme dann Pi4 4GB, installiere Docker um Paperless-ng zu installieren. Pi und Drucker per LAN an Fritzbox. Kann ich dann so die Dateien mit dem Windows PC durchsuchen?

    therealpink09.04.2022 22:44

    Im Privatbereich reicht imho eine brauchbare Verschlagwortung und …Im Privatbereich reicht imho eine brauchbare Verschlagwortung und Chronologisierung über den Dateinamen plus Volltextsuche in den PDFs.Alles andere ist eigentlich zuviel Aufwand.Beispiel: 2022_04_09_Doppeldildo_Dildoking_steuerrelevant.pdf


    Ja, im prinzip schon. Ich wollte nun nicht die Blätter einzeln einscannen. Zusätzlich will ich mit einer kleinen Nebengewerbe anfangen, vllt. hilft sowas mir dann auch. (bearbeitet)
  14. Gudder's Profilbild
    Autor*in
    fberndt09.04.2022 22:58

    Bite nimm paperless ngx. ng wird nicht mehr …Bite nimm paperless ngx. ng wird nicht mehr weiterentwickelt.https://github.com/paperless-ngx/paperless-ngxPaperless stellt ein Webinterface, über das man seine Dokumente im Browser verwalten kann. Eine App gibt es auch noch. Die Dateinamen können frei gewählt werden, sodass auch eine Suche über den Dateiexplorer möglich ist. Die Verschlagwortung geht halbwegs automatisch, wenn man es mal eingestellt hat. OCR wird automatisch durchgeführt. Nicht jedes PDF enthält von Haus aus durchsuchbaren Text. Deshalb muss es auch ein etwas stärkerer Pi sein.


    Ok Danke.

    Die einzige Frage für mich ist nun, ob folgende Konstellation dafür funktionieren würde:

    Pi 4 -> Docker -> Paperless-ngx,
    Wo könnte ich die Dateien speichern, so dass ich auf sie von überall zugreifen kann ( wenigstens mit dem Windows PC)

    Gibt es eine Seite mit ausführlichen Einzelschritten für die Aufsetzung?

    Danke im Voraus
  15. quellcode's Profilbild
    Wenn du nur den einen Windows-PC hast, kannst du dein Paperless in einer VM installieren. Aber ich denke auch, dass bei 10 Ordnern brauchbare Dateinamen und die Windows-Suche ausreichen sollten. (bearbeitet)
  16. DeltaC's Profilbild
    Schau dir mal Ecodms an.
  17. siedenburgg's Profilbild
    GelöschterUser169198410.04.2022 09:21

    Ein RAID ist dafür nicht nötig. Das braucht man nur, wenn man keine Zeit h …Ein RAID ist dafür nicht nötig. Das braucht man nur, wenn man keine Zeit hat, darauf zu warten, bis das Backup zurückgespielt ist.Auch ein NAS ist vollkommen unnötig.Einzig mehrere verteilte Backups braucht man.


    raid bei einem einfachen dokumentensystem wäre aber nicht so viel teurer. statt eine 2tb platte für 60€ kommen 2 rein und man hat genug speicher für dokumente. Zudem hat man den vorteil das eine platte wegfallen kann ohne das man alles neu einrichten muss. aber ja verteilte backups sind wichtiger. sonst brennt es mal, oder man schleppt sich schadware ins system und alles ist weg.
  18. GelöschterUser1691984's Profilbild
    siedenburgg10.04.2022 11:45

    raid bei einem einfachen dokumentensystem wäre aber nicht so viel teurer. …raid bei einem einfachen dokumentensystem wäre aber nicht so viel teurer. statt eine 2tb platte für 60€ kommen 2 rein und man hat genug speicher für dokumente. Zudem hat man den vorteil das eine platte wegfallen kann ohne das man alles neu einrichten muss. aber ja verteilte backups sind wichtiger. sonst brennt es mal, oder man schleppt sich schadware ins system und alles ist weg.


    Na mindestens doppelt so teuer, weil zwei Festplatten. Und dabei ist das Gehäuse, das RAID kann, noch nicht enthalten.
  19. therealpink's Profilbild
    2000flash200010.04.2022 13:28

    @Gudder Ich habe die letzten Monate mich ebenfalls mit der Thematik …@Gudder Ich habe die letzten Monate mich ebenfalls mit der Thematik auseinander gesetzt und bin zum Schluss bei PaperOffice gelandet. Ist aus meiner Sicht die genialste Software, die es gibt und dazu noch (in der Grundversion, die aber ausreicht) kostenfrei.Kurzanleitung zur Installation ist u.a. hier zu finden:[Video]


    Wie lange hast du gebraucht, um ein brauchbares Setup zu haben?
    Wie lange braucht man pro bestehendem Dokument zur Erfassung?
  20. 2000flash2000's Profilbild
    therealpink10.04.2022 15:17

    Wie lange hast du gebraucht, um ein brauchbares Setup zu haben?Wie lange …Wie lange hast du gebraucht, um ein brauchbares Setup zu haben?Wie lange braucht man pro bestehendem Dokument zur Erfassung?


    Wenn die Installation durch ist, ist der Rest ne Sache von Sekunden.
    PaperOffice hat ne ziemlich gute Scansoftware mit an Board. Je nach Scanner ist ne Seite im Duplex in 3-5 Sekunden durch. Danach noch auswählen, ob man eine intelligente Aufarbeitung durchführen will (Text auslesen, automatische Verschlagwortung usw) oder nicht und letztendlich abspeichern. Fertig ist die Kiste.Alternativ gescannte Dokumente per drag&drop in die Software reinziehen und dann abspeichern.

    Man kann sich auch komplexe Erfassungssysteme zusammenbasteln mit automatischer Erkennung des Dokuments und Zuordnung zu einem Verkäufer / Lieferer (bei Rechnungen), auslesen von Rechnungsbetrag und Datum und das dann auch in entsprechende Unterordner automatisch abspeichern lassen. Da kann ich jetzt aber schlecht sagen, wie lange man dafür braucht. Wenn man sich im System auskennt ist das aber auch mit ein paar Klicks erledigt und die Vorlage in ner halben Minute fertig.
  21. derjupp's Profilbild
    Mmhhh... schwieriges Thema. Aus eigener Erfahrung kann ich dir sagen, dass du je nach Setup auch viel Zeit verlierst das System am laufen zu halten, insbesondere wenn du alles selbst hosten willst und dann mal einen Ausfall hast. Ich habe bis heute keine solche Software und komme, wie es schon empfohlen wurde, mit sinnvollen Dateinamen und Ordnern bestens klar.

    Vielleicht reicht dir aber auch das schon:
    Wenn du scannst, dann auch direkt mit ocr in PDF. Dann in Windows - Systemsteuerung - Indizierungsdienst (oder so ähnlich) den Ordner/die Ordner/das Laufwerk hinzufügen und nachdem er den Index zum ersten mal vollständig aufgebaut hat, kannst du bequem über die Windows Suche auch nach dem Inhalt in den Dateien suchen.

    PS: bereits existierende Scans kann man natürlich auch nochmal durch eine ocr Software laufen lassen und speichern. Manche Scannersoftware bietet sowas an, Abby zum Beispiel. Oder du machst es einfach mit pdf24, dafür kann man sich dann sogar ein kleines Script schreiben und auf die Sammlung loslassen. (bearbeitet)
  22. derjupp's Profilbild
    Badwek10.04.2022 05:09

    Einfach alles einscannen und auf OneDrive tuen. Grund: OneDrive übernimmt …Einfach alles einscannen und auf OneDrive tuen. Grund: OneDrive übernimmt OCR Erkennung auf allen Dokumenten und Bildern. Du musst also nichts machen. Ich selbst habe SnapScan benutzt, um alle Dokument einzuscannen.


    Aus Datenschutzsicht natürlich äußerst fragwürdig. Die analysieren den Inhalt deiner Dateien ja nicht aus reiner Nächstenliebe zum Nulltarif.35909471-SFJc9.jpg
  23. Gudder's Profilbild
    Autor*in
    So, habe probiert und kann sagen, dass der Epson Drucker ein Stapel Unterlagen (mit Leerseite als Trenner) auch die doppelseitigen Unterlagen als PDF auf meinem Windows-PC speichern kann. Beide sind per LAN an Fritzbox angebunden. Der PC hat eine 1TB SSD als Timemachine und macht automatisch die Backups.

    Ich könnte nun Hyper-V von Microsoft als VM installieren und darauf dann Paperless-ngx um die PDFs mit OCR zu versehen und abzulegen.

    Oder fehlt vielleicht ein Zwischenschritt?
  24. Krokoschwein's Profilbild
    Allgemein Dokumanagment

    Kofax Paperport / Everdoc wären schon mal 2 Kandidaten.
    Da kann man Testversionen laden.

    Und auch MS Onenote - gratis - kann man dafür missbrauchen. (bearbeitet)
  25. benba's Profilbild
    2000flash200010.04.2022 13:28

    @Gudder Ich habe die letzten Monate mich ebenfalls mit der Thematik …@Gudder Ich habe die letzten Monate mich ebenfalls mit der Thematik auseinander gesetzt und bin zum Schluss bei PaperOffice gelandet. Ist aus meiner Sicht die genialste Software, die es gibt und dazu noch (in der Grundversion, die aber ausreicht) kostenfrei.Kurzanleitung zur Installation ist u.a. hier zu finden:[Video]


    500 Seiten sind bisl mau...

    Gudder11.04.2022 11:29

    So, habe probiert und kann sagen, dass der Epson Drucker ein Stapel …So, habe probiert und kann sagen, dass der Epson Drucker ein Stapel Unterlagen (mit Leerseite als Trenner) auch die doppelseitigen Unterlagen als PDF auf meinem Windows-PC speichern kann. Beide sind per LAN an Fritzbox angebunden. Der PC hat eine 1TB SSD als Timemachine und macht automatisch die Backups. Ich könnte nun Hyper-V von Microsoft als VM installieren und darauf dann Paperless-ngx um die PDFs mit OCR zu versehen und abzulegen.Oder fehlt vielleicht ein Zwischenschritt?


    Kannst auch docker Desktop direkt installieren und nutzen. (bearbeitet)
  26. Gudder's Profilbild
    Autor*in
    36144232-R9Idy.jpgIch habe Papiermessers-ngx auf Raspi installiert, wie auf github beschrieben ist. Leider bekomme ich diesen Fehler und habe alles probiert, was im Netz so vorgeschlagen wurde. Hat jmd. eine Lösung?
  27. EAS-Ben04's Profilbild
    Gibts hierfür ne Anleitung für Dummies für Paperless NGX?
  28. benba's Profilbild
    Gudder05.05.2022 20:53

    [Bild] Ich habe Papiermessers-ngx auf Raspi installiert, wie auf github …[Bild] Ich habe Papiermessers-ngx auf Raspi installiert, wie auf github beschrieben ist. Leider bekomme ich diesen Fehler und habe alles probiert, was im Netz so vorgeschlagen wurde. Hat jmd. eine Lösung?


    Der Fehler ist ja eindeutig was hast du denn bereits probiert?

    EAS-Ben0415.06.2022 11:04

    Gibts hierfür ne Anleitung für Dummies für Paperless NGX?


    Docker, oder Linux? (bearbeitet)
  29. AnonymerBenutzer's Profilbild
    . (bearbeitet)
  30. FoxyJackal's Profilbild
    Paperwork oder Ecodms
  31. GrantOWL's Profilbild
    Ecodms würde ich nicht unterstützen. Die Aachener Firma ist rotzfrech.

    Paperless NGX oder Zotero.

    ---

    Pro Beide:

    + Open Source
    + Auf allen Betriebssystem besteht zumindest eine Verfügbarkeit.

    ---

    Pro Paperless NGX:

    + Wirklich sehr gute UI und Erkennung.

    Con:
    - Server mit ausreichend Speicherplatz notwendig (dadurch teuer)
    - Administration aufwendiger
    - 3 Dockercontainer, was erfahrungsgemäß ab und an im laufenden Betrieb zu Problemen führen kann.

    ---

    Pro Zotero:

    + Webdav Support, dadurch wirklich günstig im Unterhalt. Ich nutzt z.B. Koofr aus dem LifeTime Stack Social deal. Alternativ 1TB Hetzner Storage Box für unter 1€ im Monat.
    + Linux, Mac und Windows Anwendungen stehen zur Verfügung.
    + Einfache Backup Routinen mit Syncthing möglich
    + PDF Editor an Board
    + Ordner Struktur möglich
    + Daten liegen bei Bedarf an min. 2 Orten (deinem Rechner + Webdav Server).
    + Begrenzte Synchronisation auch möglich (Abruf des Dokumentes nur bei Verwendung).

    Con:
    - Android Anbindung könnte besser sein.
    - Kein OCR
    - Keine Routinen etc.


    P.s Wenn du Apple Only Nutzer bist schau dir Devonthing an! Das vereint die Vorteile von Zotero mit denen von Paperless.
's Profilbild