TEIhub
Discover TEI-encoded documents from GitHub public repositories.

Last indexed Repository Description Languages Matching files
02 Feb 2023 09:46 UTC Arbaletos/​UD_​Esperanto-​ETB - epo 3
30 May 2020 05:30 UTC Arbaletos/​eo_​gramsin - epo 136
30 May 2020 05:30 UTC araborn/​pessoa - por, eng 92
30 May 2020 05:29 UTC araborn/​coerp_​new - - 1
28 Jun 2021 08:40 UTC Arabic-​TEI-​Workshop/​examples - eng, ara 3
30 May 2020 05:30 UTC aprokh/​RMTP_​Summer16 - rus 25
04 Aug 2022 11:42 UTC apreus/​paris-​project - eng, fra, rus, ita 13
30 May 2020 05:29 UTC apjanco/​xml_​thing - spa 3
30 May 2020 05:29 UTC apilcs/​website - eng, zho 1
16 May 2021 08:47 UTC apache/​tika The Apache Tika toolkit detects and extracts metadata and text from over a thousand different file types (such as PPT, XLS, and PDF). eng 2
30 May 2020 05:29 UTC apache/​forrest Mirror of Apache Forrest - 2
30 May 2020 05:29 UTC ap2253ap/​p4h Files for use in the Fall 2016 P4H course - 5
30 May 2020 05:30 UTC AnZadykhina/​notes-​de-​cours - fro 8
29 Oct 2020 12:47 UTC anya-​bel/​vocamprove B(est) team project for NLP and WrCor courses - 182
30 May 2020 05:30 UTC anuvivn/​wd-​2 - bul, ces, eng, est, hrv, hun, mkd, pol, ron, rus, sh, slk, slv, srp, ukr, fas 523
13 Dec 2022 17:44 UTC Antonomaz/​ODD Ce répertoire contient les schémas de validation des textes encodés ainsi que la documentation de l'encodage. fra 3
15 Dec 2022 19:44 UTC Antonomaz/​Corpus Collection de mazarinades encodées en XML-TEI. fra 4422
29 Sep 2022 10:54 UTC antonkarl/​iceErrorCorpusSpecialized Icelandic Specialized Error Corpora for texts written by learners of Icelandic as a second language and individuals who have dyslexia. - 243
24 Nov 2021 01:39 UTC antonkarl/​iceErrorCorpus An Icelandic Error corpus, annotated for mistakes related to spelling, grammar, and other issues. - 4046
30 May 2020 05:30 UTC antonkarl/​icecorpus Icelandic Treebank - 2267
30 May 2020 05:30 UTC antonhand/​bibreco - eng, fra, deu, spa, ita, pol 1
11 Nov 2022 11:44 UTC antology-​xviii/​antology Antology code and data - 100
30 May 2020 05:29 UTC antoineodier/​egodocuments-​transcriptions - deu, lat, fra 11
30 May 2020 05:30 UTC antoinecourtin/​EbD_​2018 - fra 4
30 May 2020 05:30 UTC antoinecourtin/​DEFI_​2019 Repo utile pour le cours 3LDF904l - 3LDF906l, Master DEFI, 2019-2020 fra 4
15 Dec 2022 08:48 UTC Anto2000-​hub/​Esame_​Codifica_​di_​Testi - ita 1
26 Jan 2026 20:06 UTC Anterotesis/​historical-​texts Collections of english historical texts and data relating to them lat, eng, sco, fra, cym, frm, roa, deu, ita, mul, zxx, grc, fro, nld, spa, pau 32851
30 May 2020 05:29 UTC anser0301/​Pushkin - - 1
30 May 2020 05:30 UTC anrExperts/​projet - fra 1
16 Jul 2021 04:48 UTC anrExperts/​data Données de l’ANR experts fra 1
30 May 2020 05:29 UTC ANRChoucas/​Livrable-​5.​1.​1 - - 5
31 May 2022 08:52 UTC ANRChoucas/​choucas-​demo-​services - - 2
11 Jul 2020 20:32 UTC ANRChapitres/​xmlConvert Small snipets for xml conversion, from Calibre epub to TEI fra 227
30 May 2020 05:29 UTC ANRChapitres/​tagging a java adpater to transform TEI text to postagged TEI text - 1
30 May 2020 05:29 UTC ANRChapitres/​stats_​oldcode bunch of basic data queries (nb of chaps per year, nb of words per chap per year) - 3
15 Nov 2022 21:45 UTC ANRChapitres/​2000romans19e20e Corpus de 2000 romans français du 19e et 20e siècles libres de droit en xml-tei - 460
10 Mar 2023 17:45 UTC ANR-​MARITEM/​edition - afr 9
30 May 2020 05:29 UTC ANR-​CHispa/​XMLify Outil de conversion d'un fichier de métadonnées (CSV) en XML. Pour cela, on utilise un fichier de mapping qui fait correspondre à chaque colonne de métadonnées une arborescence XML. Cette "arborescence" est assemblée à un arbre vide : un fichier XML modèle. Chaque ligne de données est convertie en un fichier XML séparé, dont le nom est construit à partir de la donnée trouvée dans une colonne spécifiée par l'utilisateur. Actuellement le lancement s'effectue en ligne de commande en vue d'une utilisation "massive" automatisée dans une chaine de traite ment complète. Nous pensons développer une interface graphique facilitant sa prise en main. Pour lancer ce programme en ligne de commande : >> python XMLify.py XmlBase mapFile dataFile outFolder refColumn -XmlBase : un fichier XML-TEI minimal contenant un arbre XML-TEI vide mais valide. Par défault utilisez le fichier teiHeader.xml -mapFile : un fichier CSV contenant les règles de conversions entre les données brut (csv) et son équivalence en TEI. Par défault utilisez le fichier mapping.xml -dataFile : fichier CSV contenant les données bruts à encoder. Pour un essai utilisez le fichier datasample.csv -outFolder : le dossier de destination pour les fichiers XML-TEI générés par ce programme -refColumn : un nom de colonne present dans le dataFile utilisé pour produire des noms de fichiers de sorties distincts et intelligibles. Par exemple la "cote". - 1
30 May 2020 05:30 UTC ANR-​Ampere/​sourcesAmpere - fra 1839
01 Nov 2020 20:32 UTC anonymous-​poetrybot-​386/​eacl-​metrical-​tagging-​in-​the-​wild This is the anonymous repository for our poetry submissions. eng, deu 251
30 May 2020 05:29 UTC anonymernautilus/​myteisite - - 1
22 Sep 2022 07:59 UTC anon-​applicant/​Zipfs-​Law A layman's introduction to Zipf's Law through computational linguistics. - 77
09 Mar 2021 04:47 UTC annplaksin/​mensural_​sourceEncoding - - 1
17 Mar 2023 07:46 UTC annotation/​text-​tools Lower level tools for the manipulation and publishing of texts and annotations - 5
14 Dec 2021 20:39 UTC annotation/​annotation-​paradigm Save queries as annotations. Demo for the WIVU database of the Hebrew Bible - 329
30 May 2020 05:29 UTC annlor/​StageJulien - fra 2
17 Apr 2023 07:45 UTC annikaeklund/​annikaeklund.​github.​io - eng, lat, ell, srp, isl, cym, dan, lit, fro, heb, sqi, non, slv, ava, fra, deu, spa, ita, kor, zho 52
30 May 2020 05:29 UTC AnneLHuet/​projetEurykleia - mul 2
17 Aug 2020 04:32 UTC annelegrandjazz/​Devoir-​XSLT Transformation XSLT de mon projet XML TEI des Lettres 142 et 143 de Madame de Sévigné pour créer une visualisation HTML. fra 1
08 Jul 2021 20:36 UTC annelegrandjazz/​Devoir_​XML_​TEI_​2021 Transformation XSLT de mon projet XML TEI de la correspondance d'Hugues Panassié avec Charles Delaunay pour créer une visualisation HTML. fra 3