Discover TEI-encoded documents from GitHub public repositories.
| Last indexed | Repository | Description | Languages | Matching files |
|---|---|---|---|---|
| 02 Feb 2023 09:46 UTC | Arbaletos/UD_Esperanto-ETB | - | epo | 3 |
| 30 May 2020 05:30 UTC | Arbaletos/eo_gramsin | - | epo | 136 |
| 30 May 2020 05:30 UTC | araborn/pessoa | - | por, eng | 92 |
| 30 May 2020 05:29 UTC | araborn/coerp_new | - | - | 1 |
| 28 Jun 2021 08:40 UTC | Arabic-TEI-Workshop/examples | - | eng, ara | 3 |
| 30 May 2020 05:30 UTC | aprokh/RMTP_Summer16 | - | rus | 25 |
| 04 Aug 2022 11:42 UTC | apreus/paris-project | - | eng, fra, rus, ita | 13 |
| 30 May 2020 05:29 UTC | apjanco/xml_thing | - | spa | 3 |
| 30 May 2020 05:29 UTC | apilcs/website | - | eng, zho | 1 |
| 16 May 2021 08:47 UTC | apache/tika | The Apache Tika toolkit detects and extracts metadata and text from over a thousand different file types (such as PPT, XLS, and PDF). | eng | 2 |
| 30 May 2020 05:29 UTC | apache/forrest | Mirror of Apache Forrest | - | 2 |
| 30 May 2020 05:29 UTC | ap2253ap/p4h | Files for use in the Fall 2016 P4H course | - | 5 |
| 30 May 2020 05:30 UTC | AnZadykhina/notes-de-cours | - | fro | 8 |
| 29 Oct 2020 12:47 UTC | anya-bel/vocamprove | B(est) team project for NLP and WrCor courses | - | 182 |
| 30 May 2020 05:30 UTC | anuvivn/wd-2 | - | bul, ces, eng, est, hrv, hun, mkd, pol, ron, rus, sh, slk, slv, srp, ukr, fas | 523 |
| 13 Dec 2022 17:44 UTC | Antonomaz/ODD | Ce répertoire contient les schémas de validation des textes encodés ainsi que la documentation de l'encodage. | fra | 3 |
| 15 Dec 2022 19:44 UTC | Antonomaz/Corpus | Collection de mazarinades encodées en XML-TEI. | fra | 4422 |
| 29 Sep 2022 10:54 UTC | antonkarl/iceErrorCorpusSpecialized | Icelandic Specialized Error Corpora for texts written by learners of Icelandic as a second language and individuals who have dyslexia. | - | 243 |
| 24 Nov 2021 01:39 UTC | antonkarl/iceErrorCorpus | An Icelandic Error corpus, annotated for mistakes related to spelling, grammar, and other issues. | - | 4046 |
| 30 May 2020 05:30 UTC | antonkarl/icecorpus | Icelandic Treebank | - | 2267 |
| 30 May 2020 05:30 UTC | antonhand/bibreco | - | eng, fra, deu, spa, ita, pol | 1 |
| 11 Nov 2022 11:44 UTC | antology-xviii/antology | Antology code and data | - | 100 |
| 30 May 2020 05:29 UTC | antoineodier/egodocuments-transcriptions | - | deu, lat, fra | 11 |
| 30 May 2020 05:30 UTC | antoinecourtin/EbD_2018 | - | fra | 4 |
| 30 May 2020 05:30 UTC | antoinecourtin/DEFI_2019 | Repo utile pour le cours 3LDF904l - 3LDF906l, Master DEFI, 2019-2020 | fra | 4 |
| 15 Dec 2022 08:48 UTC | Anto2000-hub/Esame_Codifica_di_Testi | - | ita | 1 |
| 26 Jan 2026 20:06 UTC | Anterotesis/historical-texts | Collections of english historical texts and data relating to them | lat, eng, sco, fra, cym, frm, roa, deu, ita, mul, zxx, grc, fro, nld, spa, pau | 32851 |
| 30 May 2020 05:29 UTC | anser0301/Pushkin | - | - | 1 |
| 30 May 2020 05:30 UTC | anrExperts/projet | - | fra | 1 |
| 16 Jul 2021 04:48 UTC | anrExperts/data | Données de l’ANR experts | fra | 1 |
| 30 May 2020 05:29 UTC | ANRChoucas/Livrable-5.1.1 | - | - | 5 |
| 31 May 2022 08:52 UTC | ANRChoucas/choucas-demo-services | - | - | 2 |
| 11 Jul 2020 20:32 UTC | ANRChapitres/xmlConvert | Small snipets for xml conversion, from Calibre epub to TEI | fra | 227 |
| 30 May 2020 05:29 UTC | ANRChapitres/tagging | a java adpater to transform TEI text to postagged TEI text | - | 1 |
| 30 May 2020 05:29 UTC | ANRChapitres/stats_oldcode | bunch of basic data queries (nb of chaps per year, nb of words per chap per year) | - | 3 |
| 15 Nov 2022 21:45 UTC | ANRChapitres/2000romans19e20e | Corpus de 2000 romans français du 19e et 20e siècles libres de droit en xml-tei | - | 460 |
| 10 Mar 2023 17:45 UTC | ANR-MARITEM/edition | - | afr | 9 |
| 30 May 2020 05:29 UTC | ANR-CHispa/XMLify | Outil de conversion d'un fichier de métadonnées (CSV) en XML. Pour cela, on utilise un fichier de mapping qui fait correspondre à chaque colonne de métadonnées une arborescence XML. Cette "arborescence" est assemblée à un arbre vide : un fichier XML modèle. Chaque ligne de données est convertie en un fichier XML séparé, dont le nom est construit à partir de la donnée trouvée dans une colonne spécifiée par l'utilisateur. Actuellement le lancement s'effectue en ligne de commande en vue d'une utilisation "massive" automatisée dans une chaine de traite ment complète. Nous pensons développer une interface graphique facilitant sa prise en main. Pour lancer ce programme en ligne de commande : >> python XMLify.py XmlBase mapFile dataFile outFolder refColumn -XmlBase : un fichier XML-TEI minimal contenant un arbre XML-TEI vide mais valide. Par défault utilisez le fichier teiHeader.xml -mapFile : un fichier CSV contenant les règles de conversions entre les données brut (csv) et son équivalence en TEI. Par défault utilisez le fichier mapping.xml -dataFile : fichier CSV contenant les données bruts à encoder. Pour un essai utilisez le fichier datasample.csv -outFolder : le dossier de destination pour les fichiers XML-TEI générés par ce programme -refColumn : un nom de colonne present dans le dataFile utilisé pour produire des noms de fichiers de sorties distincts et intelligibles. Par exemple la "cote". | - | 1 |
| 30 May 2020 05:30 UTC | ANR-Ampere/sourcesAmpere | - | fra | 1839 |
| 01 Nov 2020 20:32 UTC | anonymous-poetrybot-386/eacl-metrical-tagging-in-the-wild | This is the anonymous repository for our poetry submissions. | eng, deu | 251 |
| 30 May 2020 05:29 UTC | anonymernautilus/myteisite | - | - | 1 |
| 22 Sep 2022 07:59 UTC | anon-applicant/Zipfs-Law | A layman's introduction to Zipf's Law through computational linguistics. | - | 77 |
| 09 Mar 2021 04:47 UTC | annplaksin/mensural_sourceEncoding | - | - | 1 |
| 17 Mar 2023 07:46 UTC | annotation/text-tools | Lower level tools for the manipulation and publishing of texts and annotations | - | 5 |
| 14 Dec 2021 20:39 UTC | annotation/annotation-paradigm | Save queries as annotations. Demo for the WIVU database of the Hebrew Bible | - | 329 |
| 30 May 2020 05:29 UTC | annlor/StageJulien | - | fra | 2 |
| 17 Apr 2023 07:45 UTC | annikaeklund/annikaeklund.github.io | - | eng, lat, ell, srp, isl, cym, dan, lit, fro, heb, sqi, non, slv, ava, fra, deu, spa, ita, kor, zho | 52 |
| 30 May 2020 05:29 UTC | AnneLHuet/projetEurykleia | - | mul | 2 |
| 17 Aug 2020 04:32 UTC | annelegrandjazz/Devoir-XSLT | Transformation XSLT de mon projet XML TEI des Lettres 142 et 143 de Madame de Sévigné pour créer une visualisation HTML. | fra | 1 |
| 08 Jul 2021 20:36 UTC | annelegrandjazz/Devoir_XML_TEI_2021 | Transformation XSLT de mon projet XML TEI de la correspondance d'Hugues Panassié avec Charles Delaunay pour créer une visualisation HTML. | fra | 3 |