Case Study · Computer Vision & GenAI
Book Lister AI
Desktop-App, die gebrauchte Bücher in unter 30 Sekunden scannt, per Gemini-Vision erfasst, live bepreist und bei eBay listet. +400 % Durchsatz durch Computer Vision und GenAI.
- +0%
- mehr Durchsatz pro Mitarbeiter
- 300 Sek
- pro Buch statt 3 bis 5 Minuten von Hand
- 0 / 5
- Kundenbewertung via Upwork
Die Herausforderung
Im Gebrauchtbuchhandel ist der Flaschenhals nicht der Verkauf, sondern die Datenerfassung. Pro Buch verbrachte das Personal bisher 3 bis 5 Minuten mit Fotografieren, Abtippen (Titel, Autor, ISBN), Preisrecherche, SEO-Optimierung und Upload. Bei tausenden Büchern pro Monat summiert sich das zu enormen Personalkosten, bevor der erste Euro verdient ist.
Die Lösung: Hardware trifft KI
Eine End-to-End-Pipeline, die den physischen Scan-Prozess mit multimodaler KI und Live-APIs verknüpft:
- Smart Scanning. Das Buch liegt auf einer mit ArUco-Markern kalibrierten Matte. Die Webcam korrigiert die Perspektive in Echtzeit, vermisst die Dimensionen physisch (automatische Versandklassen) und scannt den Barcode.
- KI-Datenextraktion. Zwei hochauflösende Scans (Cover + Rückseite) gehen an
Gemini 2.5 Flash. Ein striktes JSON-Schema extrahiert Titel, Autor, Verlag, Jahr. - Automatisches Pricing. Abgleich mit der Google Books API, Abfrage der eBay Browse API nach Live-Konkurrenzangeboten, Kalkulation eines wettbewerbsfähigen Preises mit Profit-Margin-Sicherung.
- Hintergrund-Upload. Ein Klick, ein Background-Worker pusht das Listing via eBay Trading API live, während das nächste Buch bereits gescannt wird.
Engineering Highlights & Fail-Safe-Architektur
Absolute Zuverlässigkeit war der Kernfokus, die App läuft im Lagerbetrieb, Ausfälle kosten direkt Geld:
- Trust-but-Verify bei KI-Daten. Da LLMs gelegentlich ISBNs halluzinieren, behandelt die Architektur den KI-Output nur als Hypothese. Die ISBN wird zwingend gegen den Hardware-Barcode-Scan und einen Google-Books-Fuzzy-Match (
thefuzz) validiert. Fehlerhafte Daten werden blockiert, bevor sie das Listing korrumpieren. - Hybrid Computer Vision. Duales Barcode-Decoding-System (
ZBarfür saubere,zxing-cppfür beschädigte Codes), maximale Erkennungsraten auch bei alten, verkratzten Büchern. - Thread-Safe Capture Pipeline. Um Windows-
STATUS_HEAP_CORRUPTION-Abstürze durch konkurrierende Kamera-Restarts zu verhindern: strikte VideoCapture-Ownership in einem dedizierten, Watchdog-überwachten Capture-Thread. - Zero-Touch Database Migrations. SQLite im WAL-Modus mit automatischer Schema-Migration beim App-Start. Jede Migration durch eine explizite
pytest-Suite abgesichert. Updates rollen ohne manuellen Kundeneingriff.
Das Ergebnis
- +400 % Durchsatz. Von 3–5 Minuten pro Buch auf unter 30 Sekunden.
- Kaltstart → erster Frame: 2–4 Sekunden.
- Scan → Preis: 4–6 Sekunden.
- ~6.450 LOC Produktionscode, abgesichert durch ~2.720 LOC Unit Tests (260+ pytest-Tests) + GitHub Actions CI.
- Deployment: 165 MB monolithische PyInstaller-Executable, ein Doppelklick, fertig.
Diese Leistung anfragen
Custom AI Desktop App
Eine Windows-App mit AI-Backend, Hardware-Integration und API-Pipeline, wie hier gebaut, mit Tests und Installer. Für Workflows, die kein SaaS-Tool abdeckt.
Weitere Projekte
AWS Kostenoptimierung
65 % weniger AWS-Kosten (3.850 $ → 1.330 $ / Monat) durch sicheren Rückbau einer Legacy-Plattform, Zero Downtime.
Legacy-DB Reverse Engineering & Migration
1,47 Mio. Bauteile aus einer 1,2 GB passwortgeschützten Hersteller-Datenbank befreit und ins neue System migriert, null Regelverstöße, vollständig auditierbar.
Microsoft Shopping Feed Pipeline
Vollautomatischer täglicher Sync großvolumiger Affiliate-Feeds (Connexity, Shopping24) ins Microsoft Merchant Center, OOM-sicher, chunked-Upload, 100 % konform.