Artikkelen redegjør for et forskningsarbeid der samtlige av Nasjonalbibliotekets digitaliserte bøker i perioden 1814–1905 (22946 titler per 2022) er manuelt gjennomgått og klassifisert i et korpus med 20 kategorier. Artikkelen tilbyr dokumentasjon til brukere av korpuset, den drøfter grunnleggende prinsipper for digital korpusbygging, og den viser frem noen funn fra arbeidet.