Zum Inhalt springen
← Zurück zur Übersicht

Case Study · Computer Vision & GenAI

OpenCV Gemini eBay API SQLite

Book Lister AI

Desktop-App, die gebrauchte Bücher in unter 30 Sekunden scannt, per Gemini-Vision erfasst, live bepreist und bei eBay listet. +400 % Durchsatz durch Computer Vision und GenAI.

+0%
mehr Durchsatz pro Mitarbeiter
300 Sek
pro Buch statt 3 bis 5 Minuten von Hand
0 / 5
Kundenbewertung via Upwork

Die Herausforderung

Im Gebrauchtbuchhandel ist der Flaschenhals nicht der Verkauf, sondern die Datenerfassung. Pro Buch verbrachte das Personal bisher 3 bis 5 Minuten mit Fotografieren, Abtippen (Titel, Autor, ISBN), Preisrecherche, SEO-Optimierung und Upload. Bei tausenden Büchern pro Monat summiert sich das zu enormen Personalkosten, bevor der erste Euro verdient ist.

Die Lösung: Hardware trifft KI

Eine End-to-End-Pipeline, die den physischen Scan-Prozess mit multimodaler KI und Live-APIs verknüpft:

  • Smart Scanning. Das Buch liegt auf einer mit ArUco-Markern kalibrierten Matte. Die Webcam korrigiert die Perspektive in Echtzeit, vermisst die Dimensionen physisch (automatische Versandklassen) und scannt den Barcode.
  • KI-Datenextraktion. Zwei hochauflösende Scans (Cover + Rückseite) gehen an Gemini 2.5 Flash. Ein striktes JSON-Schema extrahiert Titel, Autor, Verlag, Jahr.
  • Automatisches Pricing. Abgleich mit der Google Books API, Abfrage der eBay Browse API nach Live-Konkurrenzangeboten, Kalkulation eines wettbewerbsfähigen Preises mit Profit-Margin-Sicherung.
  • Hintergrund-Upload. Ein Klick, ein Background-Worker pusht das Listing via eBay Trading API live, während das nächste Buch bereits gescannt wird.
Book Lister AI — Vorher/Nachher-Infografik

Engineering Highlights & Fail-Safe-Architektur

Absolute Zuverlässigkeit war der Kernfokus, die App läuft im Lagerbetrieb, Ausfälle kosten direkt Geld:

  • Trust-but-Verify bei KI-Daten. Da LLMs gelegentlich ISBNs halluzinieren, behandelt die Architektur den KI-Output nur als Hypothese. Die ISBN wird zwingend gegen den Hardware-Barcode-Scan und einen Google-Books-Fuzzy-Match (thefuzz) validiert. Fehlerhafte Daten werden blockiert, bevor sie das Listing korrumpieren.
  • Hybrid Computer Vision. Duales Barcode-Decoding-System (ZBar für saubere, zxing-cpp für beschädigte Codes), maximale Erkennungsraten auch bei alten, verkratzten Büchern.
  • Thread-Safe Capture Pipeline. Um Windows-STATUS_HEAP_CORRUPTION-Abstürze durch konkurrierende Kamera-Restarts zu verhindern: strikte VideoCapture-Ownership in einem dedizierten, Watchdog-überwachten Capture-Thread.
  • Zero-Touch Database Migrations. SQLite im WAL-Modus mit automatischer Schema-Migration beim App-Start. Jede Migration durch eine explizite pytest-Suite abgesichert. Updates rollen ohne manuellen Kundeneingriff.

Das Ergebnis

  • +400 % Durchsatz. Von 3–5 Minuten pro Buch auf unter 30 Sekunden.
  • Kaltstart → erster Frame: 2–4 Sekunden.
  • Scan → Preis: 4–6 Sekunden.
  • ~6.450 LOC Produktionscode, abgesichert durch ~2.720 LOC Unit Tests (260+ pytest-Tests) + GitHub Actions CI.
  • Deployment: 165 MB monolithische PyInstaller-Executable, ein Doppelklick, fertig.