Dette er en samling av modeller for OCR (optical character recognition) av samiske språk. Disse kan brukes til å gjenkjenne tekst i bilder av trykt tekst (scannede bøker, magasiner, o.l) på nordsamisk, sørsamisk, lulesamisk og inaresamisk.
Mer detaljert informasjon om trening og evaluering av modellene kan du lese i artikkelen ‘Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway’, se https://arxiv.org/abs/2501.07300.
Samlingen består tre forskjellige typer modeller: Transkribus-modeller, Tesseract-modeller og TrOCR-modeller.
Se dokumentasjonsfilen for mer informasjon.
Dette er en samling av modeller for OCR (optical character recognition) av samiske språk. Disse kan brukes til å gjenkjenne tekst i bilder av trykt tekst (scannede bøker, magasiner, o.l) på nordsamisk, sørsamisk, lulesamisk og inaresamisk.
Mer detaljert informasjon om trening og evaluering av modellene kan du lese i artikkelen ‘Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway’, se https://arxiv.org/abs/2501.07300.
Samlingen består tre forskjellige typer modeller: Transkribus-modeller, Tesseract-modeller og TrOCR-modeller.
Se dokumentasjonsfilen for mer informasjon.
Utvidet metadata
resource Common Info
resource Type: toolService
identification Info
resource Name: OCR-modeller for samiske språk
resource Name: OCR Models for Sámi Languages
description: Dette er en samling av modeller for OCR (optical character recognition) av samiske språk. Disse kan brukes til å gjenkjenne tekst i bilder av trykt tekst (scannede bøker, magasiner, o.l) på nordsamisk, sørsamisk, lulesamisk og inaresamisk.
Mer detaljert informasjon om trening og evaluering av modellene kan du lese i artikkelen 'Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway', se https://arxiv.org/abs/2501.07300.
Samlingen består tre forskjellige typer modeller: Transkribus-modeller, Tesseract-modeller og TrOCR-modeller.
Se dokumentasjonsfilen for mer informasjon.
description: This is a collection of models for OCR (optical character recognition) of Sámi languages. These can be used to recognize text in images of printed text (scanned books, magazines, etc.) in North Sámi, South Sámi, Lule Sámi, and Inari Sámi.
You can read more detailed information about the training and evaluation of the models in the article 'Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway', see https://arxiv.org/abs/2501.07300.
The collection consists of three different types of models: Transkribus models, Tesseract models, and TrOCR models.
See the documentation file for more information.
attribution Text: 'Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway', https://arxiv.org/abs/2501.07300
Dette er en samling av modeller for OCR (optical character recognition) av samiske språk. Disse kan brukes til å gjenkjenne tekst i bilder av trykt tekst (scannede bøker, magasiner, o.l) på nordsamisk, sørsamisk, lulesamisk og inaresamisk.
Mer detaljert informasjon om trening og evaluering av modellene kan du lese i artikkelen 'Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway', se https://arxiv.org/abs/2501.07300.
Samlingen består tre forskjellige typer modeller: Transkribus-modeller, Tesseract-modeller og TrOCR-modeller.
Se dokumentasjonsfilen for mer informasjon.