Christian Lawson-Perfect @christianp

0 posts0 participants0 posts today

**Jez** @petrichor@digipres.club · Apr 14

@dta_cthomas @emchateau In this case I was mostly digging up things that I already knew from about 15-20 years ago so I mainly used reference sites rather than tutorials. Mozilla Developer Network seems pretty good for that https://developer.mozilla.org/en-US/docs/Web/XML/XSLT

That said, I had a quick scan of M H Beals' "Transforming Data for Reuse and Re-publication with XML and XSL" on Programming Historian and that seems pretty good. It's focused specifically on #TEI too https://programminghistorian.org/en/lessons/transforming-xml-with-xsl

MDN Web DocsXSLT: Extensible Stylesheet Language Transformations - XML: Extensible Markup Language | MDNExtensible Stylesheet Language Transformations (XSLT) is an XML-based language used, in conjunction with specialized processing software, for the transformation of XML documents.

**Jez** @petrichor@digipres.club · Apr 11

Apr 11

Jez @petrichor@digipres.club

I have been doing #XML stuff this week, specifically #TEI. I know a lot of people don't really like #XSLT, but it reminded me that when you're working with something that's not just structured data but a stream of text where some or all of the markup is part of the flow then that hybrid imperative/declarative model works really well for representing the full range of transformations you might want to make.

Would be interested to know if there are good modern alternatives.

Continued thread

**Annika Rockenberger (she/they)** @arockenberger@fedihum.org · Apr 10 *

Apr 10 *

Annika Rockenberger (she/they) @arockenberger@fedihum.org

2/2
tl;dr #neurodivergent #freeassociation #musings

Combining proof-reading with textual markup and manual entity recognition, it becomes the perfect hyper focus activity.
I use #Transkribus for my #HTR and for the last few days, I have been unlucky with the traffic for both model training and text recognition. The queues are long and take a lot of time and I am deprived of my error hunting and current hyper fixation on #Mongolia #BogdKhanate #EasternChina #TravelDiaries #TEI #Encoding

**Auden in Austria Digital** @AAD_OeAW@fedihum.org · Apr 7 *

Apr 7 *

Auden in Austria Digital @AAD_OeAW@fedihum.org

Releasing tei-rdfa (beta)

Python utility for extracting RDFa data from TEI-XML documents
Resolves native TEI namespace formatting (through <prefixDef>)

https://pypi.org/project/tei-rdfa/
https://github.com/timofruehwirth/tei_rdfa

We welcome beta testing, feedback & contribution via #GitHub.
Boosts will be very much appreciated.

@ACDHCH_OeAW @oeaw @fwf @TEIConsortium @w3c @hcayless

PyPItei-rdfaA Python utility for extracting RDFa data from TEI-XML documents.

#TEI #XML #RDFa

**Holle Meding** @hmeding@mastodon.social · Apr 3

Apr 3

Holle Meding @hmeding@mastodon.social

Extracting Citations with LLMs

At the #LLM for HPSS workshop, @cmboulanger David Carreto Fidalgo & Andreas Wagner presented LLaMore: a Python tool for extracting citation data from unstructured legal & humanities texts using #LLMs

Unlike GROBID, LLaMore handles complex footnotes and free-form references. Early results with GPT-4o and Llama 3.3 show significantly higher accuracy when benchmarked against a new gold standard TEI-annotated dataset.

#TEI #openscience @maxplanckgesellschaft

Comparison of citation extraction tools: While GROBID performs well on familiar structured data, LLaMore with Gemini achieves up to 3× better results on footnoted, unstructured texts.

How LLaMore works: Citation data is extracted from PDFs or raw text using LLM-based extractors and exported to TEI XML; evaluation is done via F1-score against gold standard annotations.

**Annika Rockenberger (she/they)** @arockenberger@fedihum.org · Apr 1

Apr 1

Annika Rockenberger (she/they) @arockenberger@fedihum.org

Hei evening crowd!

Is there a tag for #Temperature related information in the TEI P5 tag set? I have been unsuccessful so far, but it feels odd that there wouldn't be such a thing.
"Google" lets me down, too...
#TEI #Markup #DigitalScholarlyEditions #Temperature #Réaumur

**e-editiones** @eeditiones@social.e-editiones.org · Apr 1

Apr 1

e-editiones @eeditiones@social.e-editiones.org

@eeditiones goes to #France. @turska & Helena will join the twentieth annual conference of the European Society for Textual Scholarship (#ESTS) in Tours. And they have stickers, as well as a @tei_publisher workshop and a long paper in their luggage.

Registration for #ESTS2025 is still open: https://cesr-ests2025.sciencesconf.org/

picture shows Magda and Helena and the French Flag. At the is some text saying: e-editiones going to France.

#digitalhumanities #tei

**LWL-Archivamt für Westfalen** @lwlarchivamt@fedihum.org · Mar 28

Mar 28

LWL-Archivamt für Westfalen @lwlarchivamt@fedihum.org

Digitales Manuskript?! Exkursionstag am 2. April 2025 im #lwlarchivamt & Technischen Zentrum des #LandesarchivNRW in Münster für Studierende & Forschende der #unimuenster.

Programm: 3D- & Multispektraldigitalisierung, Bundessicherungsverfilmung, Restaurierungsworkshops & Diskussionen zu Originalerhalt/DH-Methoden.

Außerdem #TEI Schulungen des @scdh im Rahmen der Frühlingsschule.

Infos: https://www.uni-muenster.de/EvTheol/gkm/forschung/fruehlingsschule/

#DigitalHumanities #Archiv #Manuskriptkulturen

**Annika Rockenberger (she/they)** @arockenberger@fedihum.org · Mar 27 *

Mar 27 *

Annika Rockenberger (she/they) @arockenberger@fedihum.org

Two things today:
The Centre for Ibsen Studies has one or two short term #XML #TEI encoding job. Look at the job offer on Jobbnorge.no https://www.jobbnorge.no/ledige-stillinger/stilling/277540/prosjektmedarbeider-i-digital-tekstutgivelse

We finally published the proceedings for the Nordic Network for Edition Philologists conference held in Oslo, in fall 2022. Both conference and proceedings struggled with pandemics and other difficult circumstances. Anyways! Out now and will be available shortly on the website of the network: https://www.nnedit.org/vol/nne_vol_15.pdf

Jobbnorge.noProsjektmedarbeider i digital tekstutgivelse (277540) | Universitetet i OsloStillingstittel: Prosjektmedarbeider i digital tekstutgivelse (277540), Arbeidsgiver: Universitetet i Oslo, Søknadsfrist: tirsdag 15. april 2025

**Christian Thomas** @dta_cthomas@fedihum.org · Mar 27

Mar 27

Christian Thomas @dta_cthomas@fedihum.org

Heut und morgen in Essen zur Konferenz "#WordsInNumbers #Data-Driven Approaches to Texts in the #Humanities and #SocialSciences", https://runip-projekt.ruhr-uni-bochum.de/words_in_numbers.html, mit S. Dipper, @felwert, J. Wieringa, J. Guldi u.a.

Ich darf die #DigitalScholarlyEditions zu #Goethe u #Humboldt vorstellen, die #ResearchData für #DigitalHumanities Ansätze liefern. Im Zentrum: die #TEI-XML-Daten der #ehd_v10 https://github.com/telota/edition-humboldt-digital u aus den Propyläen https://goethe-biographica.de/recherche/regesten.html.

Bin gespannt auf die Vorträge aller anderen!

Continued thread

**NFDI4Objects** @nfdi4objects@nfdi.social · Mar 21 *

Mar 21 *

NFDI4Objects @nfdi4objects@nfdi.social

In einem gemeinsamen Workshop der Konsortien @NFDI4Memory , @nfdi4objects und @Textplus auf der #DHd2025 wurde anhand konkreter Use Cases eine Einführung in #DublinCore, #TEI und #LIDO vermittelt, die Bedeutung von #Normdaten und #Terminologien betont und die #Minimaldatensatz-Empfehlung für #Museen und #Sammungen vorgestellt. Die Folien finden sich bei Zenodo: https://zenodo.org/records/15052040

#FAIR #CARE #NFDI #Text+ #NFDI4Memory #NFDI4Objects #Datenharmonisierung #Datenqualitaet 2/2

ZenodoQualitativ hochwertige Metadaten in digitalen EditionenMaterialien zum Workshop "Qualitativ hochwertige Metadaten in digitalen Editionen“, der im Rahmen der „DHd 2025: Under Construction“ in Bielefeld von Mitarbeiter:innen der NFDI-Konsortien Text+, NFDI4Memory, NFDI4Objects, der Verbundzentrale des GBV und dem Institut für Museumsforschung gehalten wurde. Ziel des Workshops war die praxisnahe Vermittlung von Wissen zur Bewertung und Verbesserung der Qualität von Metadaten in digitalen Editionen. Ausgehend von konkreten Fallbeispielen in Form verschiedener Überlieferungssituationen von Briefen (neu zu erschließen, Abschrift, indirekter Hinweis) wurden die Problemfelder aufgerissen, die hinsichtlich der Beschreibung der verschiedenen Arten von Metadaten auftreten können. Drei Übungsblöcken waren jeweils kurze thematischen Einführungen zu den Basisthemen Metadaten, Normdaten und kontrollierten Vokabularen, Dublin Core, LIDO sowie Datenqualität und Datenkuratierung vorangestellt. In den Praxisübungen arbeiteten die Teilnehmer:innen in Gruppen oder eigenständig mit den Metadaten-Standards Dublin Core, LIDO und TEI-XML. Die Übungen zielten darauf ab, die Erstellung von Metadatensets, auch anhand von Metadateneditoren, zu erproben und aus der eigenen Erfahrung Methoden zur Bewertung der Qualität und zur Bereinigung eigener bzw. bereits vorhandener Metadatensets zu entwickeln.

**e-editiones** @eeditiones@social.e-editiones.org · Mar 17

Mar 17

e-editiones @eeditiones@social.e-editiones.org

#eeditiones community meetup Tuesday, the 1st of April at 17:00 CEST.

Talk: "From Library Platforms to a Generic Archive Edition" by Daniela Kohler, Jesko Reiling and Elias Kreyenbühl from the Zentralbibliothek Zürich.

Just over a year ago, we began editing the letters of the music publishers and composers Hans Georg Nägeli (1773-1836) and Hermann Nägeli (1811-1872)...

Read more at: https://www.e-editiones.org/posts/community-event-library-platforms-to-generic-archive-edition

Picture shows a picture of Nägeli and has the same information as the post on it.

#digitalhumanities #tei

**e-editiones** @eeditiones@social.e-editiones.org · Mar 6

Mar 6

e-editiones @eeditiones@social.e-editiones.org

Ever wondered what a genetic edition actually is? Was it just a fairytale that scholars do not need to become web developers to publish their digital editions? And what exactly Hans Christian Andersen has to do with all this? Watch Holger Berg provide all the answers and more in his e-editiones community lecture “Genetic editions of Hans Christian Andersen's oeuvre”.

https://www.e-editiones.org/posts/community-event-hans-christian-andersen-genetic-editing/

www.e-editiones.orgGenetic editions of Hans Christian Andersen's oeuvree-editiones – Society for Scholarly Digital Editions

#digitalhumanities #editions #TEI

Continued thread

**NFDI4Objects** @nfdi4objects@nfdi.social · Mar 1 *

Mar 1 *

NFDI4Objects @nfdi4objects@nfdi.social

@Textplus @NFDI4Memory

Da dieser Workshop aufgrund des wichtigen Themas sehr schnell ausgebucht war, finden Sie hier das Abstract: https://zenodo.org/records/14943264.

#DHd2025 #Metadaten #Normdaten #Terminologien #Vokabulare #digitaleEditionen #Datenqualität #Minimaldatensatz #TEI #LIDO #DublinCore #Personennamen #Ortsnamen #Standardisierung

Wir freuen uns auf den Austausch, sowohl auf der DHd als auch danach.

ZenodoQualitativ hochwertige Metadaten in digitalen EditionenMetadaten sind der zentrale Schlüssel, um Datenpublikationen verfügbar, indexierbar und verknüpfbar zu machen. Sie geben Aufschluss über die Provenienz, Erfassung und Bearbeitung von Daten und ermöglichen den Communities, die Daten nachnutzen möchten, eine Kontextualisierung ihrer Entstehungsbedingungen. Reich an potentiellen Metadatenquellen stellen Editionen – digitale wie analoge – durch Register, Apparate, Personen- und Ortsnamen sowie die Dokumentation von Textbearbeitungsstufen die Erfassung mittels standardisierter Formate vor besondere Herausforderungen. Der Workshop fokussiert die Erzeugung standardbasierter Metadatensets von und für die Erarbeitung von Editionen unter dem Gesichtspunkt von Metadatenqualität. Im Workshop werden daher praxisnah Kenntnisse zur Bewertung und Verbesserung der Qualität von Metadaten in digitalen Editionen vermittelt. Zu den Kernelementen zählen Praxisübungen in Kleingruppen anhand konkreter Use Cases (Dublin Core, LIDO) und für die Herstellung digitaler Editionen relevanter Metadaten-Standards. Den Hands-On-Phasen vorangestellt sind konzise Einführungen zu den Feldern und Standards von Metadatenformaten, kontrollierten Vokabularen, Aspekten der Datenqualität und Phasen der Datenkuratierung.

**Huber Digital** @Huber_Digital@mastodon.social · Feb 26

Feb 26

Huber Digital @Huber_Digital@mastodon.social

Our digital editions course helps you prepare your scholarly edition using established standards and encourages adoption of good practice from the start—from text encoding, digital imaging, and QA to preservation, publication, and outreach:

https://hubers.org.uk/training/#digital-editions-course

Screenshot of session 7 of the HD|DH Digital Editions Course

#TEI #DSE #DH

**Andreas Kraenzle** @ottosmops@social.anoxinon.de · Jan 30

Jan 30

Andreas Kraenzle @ottosmops@social.anoxinon.de

Three digital editions have found their way onto the TEI Publisher Registry of e-editiones (https://www.e-editiones.org/map):
- Verona: Progetto Mambrino Digital Library https://mambrino.mappingchivalry.dlls.univr.it/,
- Münster: Exile Letters https://www.exileletters.de
- Ljubliana: Slovenian Baroque Literature
https://sbs.manuscripta.zrc-sazu.si
#DigitaleEdition #tei #teipublisher

**e-editiones** @eeditiones@social.e-editiones.org · Jan 30

Jan 30

e-editiones @eeditiones@social.e-editiones.org

A preview of TEI Publisher 10

In context of the upcoming e-editiones community meeting next Tuesday, the 4th of February at 17:00 CET @wolfgangmm will provide a sneak preview into the upcoming release.

Read more here: https://www.e-editiones.org/posts/community-event-tei-publisher-10-preview/

#TEI #digitalhumanities

Replied in thread

**Christian Thomas** @dta_cthomas@fedihum.org · Jan 30

Jan 30

Christian Thomas @dta_cthomas@fedihum.org

@A_v_Humboldt_Chronologie der Vortrag wurde von #Humboldt später publiziert in seinen publikumswirksamen „Ansichten der Natur“ unter dem Titel: „Ideen zu einer Physiognomik der Gewächse“. Gabs dann auch als Separatdruck, hier ein besonderes Exemplar mit Widmung an den
„Herrn Geh. Rath v. #Goethe
als ein schwaches Zei[-]
chen seiner dankbare[n]
Verehrung“
#DeutschesTextarchiv der @BBAW : https://www.deutschestextarchiv.de/humboldt_ideen_1806/1
#DigitalHumanities #TEI-XML

www.deutschestextarchiv.deDeutsches Textarchiv – Humboldt, Alexander von: Ideen zu einer Physiognomik der Gewächse. [Tübingen], [1806].

**Harald Lordick** @nubuker@nrw.social · Jan 30

Jan 30

Harald Lordick @nubuker@nrw.social

Cooler #Job: Projectmedewerker XML-redactie - Huygens - Amsterdam https://vacatures.knaw.nl/job/Projectmedewerker-XML-redactie-Huygens-Amsterdam/1145498455/ #XML #TEI #Edition @Textplus

vacatures.knaw.nlProjectmedewerker XML-redactie - Huygens - AmsterdamProjectmedewerker XML-redactie - Huygens - Amsterdam

**Programming Historian** @proghist@hcommons.social · Jan 24

Jan 24

Programming Historian @proghist@hcommons.social

Si has oído hablar de #TEI y quieres saber más, consulta la lección "Introducción a la codificación de textos en TEI (parte 1)" de Nicolás Vaughman #HumanidadesDigitales

https://doi.org/10.46430/phes0053

doi.orgIntroducción a la codificación de textos en TEI (parte 1) | Programming Historian

Recent searches

Search options

Administered by:

Server stats:

#tei