Commons:Timed Text/es

Para otros usos, véase Commons:File captions/es.

El texto sincronizado («TimedText») es un espacio de nombre único de Wikimedia Commons que sirve para almacenar texto descriptivo o subtítulos asociados a otros medios, como archivos de video o audio. Esta página busca explicar el concepto y uso de la herramienta.

Tanto los subtítulos descriptivos como los subtítulos ordinarios son métodos mediante los cuales visualizar texto en un televisor, monitor u otra clase de pantalla electrónica para proveer información complementaria o interpretativa. Ambos dos se utilizan, generalmente, a modo de transcripción de una porción del audio de un programa a medida que se reproduce (ya sea literal o figuradamente); a veces incluyen descripciones de elementos ajenos al habla. Esto favorece a quienes sufren tanto de discapacidad auditiva como de sordera y le facilita a los hablantes no nativos la comprensión del contenido en el archivo multimedia.

Uso

Reproductor de video demostrativo

Véase también Commons:Video/es#Subtitles_and_closed_captioning.

Las miniaturas de los videos y porciones de audio que contengan subtítulos descriptivos mostrarán el ícono CC superpuesto. Tras abrir el reproductor se activan automáticamente los subtítulos en tu idioma. Puedes usar el ícono CC, ubicado en los controles del reproductor, para cambiar el idioma, desactivar o activar los subtítulos o cambiar el estilo de los subtítulos.

El texto sincronizado se puede usar en cualquier medio que se muestre mediante una secuencia temporal:

  • Un archivo de audio.
  • Un video mudo.
  • Un video hablado.
  • Una animación enseñando un concepto o el cómo funciona algo.

Ejemplos reales:

Búsqueda

En busca de texto sincronizado
Add below the name of the video to search
(do not delete the TimedText: prefix, add the text after it, e.g. TimedText:Elephants_Dream.ogv).
REMINDER : If the TimedText doesn't exist, don't forget to add language & extension, e.g. TimedText:Elephants_Dream.ogv.en.srt) to create a TimedText page - see Commons:Timed Text
  • {{Allpages|102}} se vuelve TimedText y lista todas las páginas dentro del espacio de nombre 102.

Commons requiere un método para encontrar archivos de texto sincronizado para idiomas específicos; los siguientes sufren de las limitaciones de la herramienta de búsqueda (tales como: no se muestran todas las coincidencias; se incluyen resultados que no coinciden; falta compatibilidad con las expresiones regulares). Busca inclyendo algunos archivos .srt de texto sincronizado en distintos idiomas:

EnglishGermanFrenchPortugueseRussianSwedishUkrainianPolishIndonesian

Otras formas de ayudar al usuario a encontrar texto sincronizado:

  • {{Closed captions}} visualiza los enlaces a todos los archivos de subtítulos descriptivos disponibles para un archivo; se puede poner en una página de medios y su página de discusión.
  • {{special|Prefixindex/TimedText:{{PAGENAME}}.|stripprefix|1|subtitles}} produce un enlace a todos los archivos de texto sincronizado pertinentes (ejemplo).
  • Commons:Timed Text/search by lang visualiza enlaces de búsqueda para todos los archivos de texto sincronizado en base a cierto idioma; útil para las páginas de Commons, categorías y discusión.

Señalar y encontrar videos que necesitan subtítulos

El modelo {{Captions requested}} se puede usar para señalar que algún video necesita ser subtitulado. El modelo lo añade a la categoría «Videos needing subtitles» para que se pueda ver cuáles usuarios o autores han solicitado transcripciones.

Este modelo y categoría se encuentran dentro del sector de «Commons:WikiProject Deaf» y sus simpatizantes, «meta:Deaf Wikimedians» y Wikipedia:Wikiproyecto sordera.

Encontrar videos que necesiten subtítulos traducidos

Una forma de encontrar tales videos es abriendo una de las subcategorías de «Category:Files with closed captioning» en base al idioma inicial que prefieras y luego usar Help:FastCCI/es (ubicado en la esquina superior derecha de la página) para solo incluir los videos que no tengan subtítulos en tu idioma objetivo preferido.

Ejemplo
  • Para encontrar videos que tengan subtítulos en inglés a traducir ve a «Category:Files with closed captioning in English».
  • Entonces, pincha en la flecha de FastCCI para abrir el submenú y selecciona «En esta categoría pero no en...».
  • En el cuadro de texto ingresa la categoría pertinente en base a tu idioma objetivo preferido.
    • Para el alemán ingresa «Files with closed captioning in German».
    • Para el francés ingresa «Files with closed captioning in French».
    • Para el ruso ingresa «Files with closed captioning in Russian».

etcétera.

Discusión del texto sincronizado

El espacio de nombre «TimedText talk» es para hablar sobre las páginas correspondientes de texto sincronizado, mas también se puede usar para vincular y categorizar la página de texto sincronizado.

Tareas de manutención

Publicar

Para publicar un archivo de subtítulos ya hecho abre el mismo en tu computador dentro de un editor de texto (como el bloc de notas) y copia el contenido en una nueva página dentro del espacio de nombre «TimedText» que coincida con el nombre del archivo del video y el código del idioma.

Crear

Commons usa el formato de archivo SubRip (.srt) para los subtítulos tanto descriptivos como ordinarios. Puedes crear tales archivos de varias maneras.

Crear una página de subtítulos para archivos de Commons ya existentes

Enlace de «TimedText»

Primera opción: dentro de la página de Commons del archivo (recomendado)

Puedes usar el enlace «TimedText» ubicado en la parte superior de cualquier archivo multimedia de Commons compatible.

Segunda opción: en el mismo reproductor multimedia

Ubicación del botón CC

Al usar el botón CC en la barra de herramientas del reproductor HTML5 multimedia de Wikimedia puedes elejir un subtítulo, si es que hay, o abrir el editor de subtítulos para crearlos para el video.

Tercera opción: crear una página vacía (para usuarios avanzados)

Siempre puedes crear la página de forma directa en Commons mediante el modelo «TimedText:[Nombre_de_archivo_común_y_su.extensión].[idioma].srt»; «[Nombre_de_archivo_común_y_su.extensión]» es el nombre del archivo e [idioma] es el código ISO del idioma.

Ejemplo: para añadirle subtítulos a Sueños_de_elefante.ogg puedes crear la página TimedText:Sueños_de_elefante.ogg.es.srt para los subtítulos en español, o TimedText:Sueños_de_elefante.ogg.br.srt para los subtítulos en portugués brasileño.

Extraer subtítulos ya existentes para importarlos

Crear subtítulos a partir de un DVD

Para copiar los subtítulos ya existentes de un DVD puedes usar aplicaciones como SubRip. Una vez hecho eso, puedes copiar y pegarlos en la página de subtítulos de la wiki de Commons.

Crear subtítulos usando YouTube

YouTube deja a los usuarios que tengan una cuenta crear subtítulos a partir de cualquier archivo publicado. Ten en cuenta que el reconocimiento de voz es automatizado y da resultados repentinos. Es más preferible publicar una transcripción del archivo a YouTube; eso dará un mejor resultado. Con todo ya hecho, puedes copiar y pegar los subtítulos en la página de subtítulos de la wiki de Commons.

Pasos a seguir para crear los subtítulos (un videotutorial se puede ver aquí):

  1. Publica el archivo (el archivo multimedia ha de integrar una pista de video, mas eres libre de escoger uno vacío o cualquier otro).
  2. Mientras se publica establece el idioma indicado del video para tu archivo bajo el menú «Mostrar más».
  3. O, tras publicarlo, selecciona «Subtítulos» en los detalles específicos del video o en el navegador de YouTube Studio.
  4. Pincha en «Agregar» o «Agregar idioma».
  5. Puedes añadir subtítulos de una de tres formas:
    1. Publicando una transcripción en el formato apropiado.
    2. Copiando y pegando la transcripción.
    3. Escribiendo manualmente mientras ves el video.
  6. Los subtítulos se insertarán al video.
  7. Descarga el archivo .sbv desde el menú de subtítulos bajo el menú de tres puntos en la parte de «Edición de tiempos».
  8. Convierte los contenidos del archivo .sbv a uno .srt. Existen varias herramientas en línea que sirven para concretar este paso.
    1. ffmpeg es una opción de código abierto (instrucciones).
  9. Publica el archivo .srt a la página pertinente del video en Wikipedia Commons.

Descarga de subtítulos de YouTube

Puedes descargar subtítulos de un video de YouTube (y probablemente otros sitios web de video) así:

  1. Instala yt-dlp.
  2. Ejecuta yt-dlp --list-subs url (reemplaza la dirección web con la de YouTube).
  3. Por ejemplo, ejecuta yt-dlp --write-subs en --sub-format vtt url (reemplaza la dirección web con la de Youtube).
  4. Tal vez hayan subtítulos en formato SRT, y de ser el caso deberías usarlos en lugar del formato VTT; o simplemente puedes descargarlos todos.
  5. Convierte los subtítulos de formato VTT (o del que sean) a SRT mediante una herramienta como FFmpeg (véase #Convertir subtítulos de YouTube al formato de texto sincronizado) o una interfaz web como esta.
  6. Finalmente, puedes pegar los subtítulos en la página de texto sincronizado del video en Wikimedia Commons.

Si usas la herramienta video2commons puedes marcar «Importar subtítulos», mas esto no funciona con los subtítulos en formato .vtt (phab:T368298), así que para estos videos también necesitarás hacer los pasos previos para importar los subtítulos.

Transcripción automática

Puedes usar la herramienta de código abierto SoniTranslate para generar rápida y fácilmente subtítulos transcritos automáticamente. Lo ideal sería que revises los subtítulos, especialmente si también usas la herramienta para traducir de forma automática a otros idiomas. Por ejemplo, puede que dé como resultado los años como oraciones extensas en vez de números o malinterpretar los nombres de la gente. El cómo usar esta herramienta se describe en Help:AI video dubbing. [1] Si no hay subtítulos que importar esta es, posiblemente, la forma más expedita de añadir textos sincronizados. La transcripción generalmente solo se demora unos cuantos segundos, incluso si no tienes una tarjeta gráfica, aunque depende de cuán largo sea el video.

Los intervalos de tiempo se hacen de tal manera que encajen justo para poder acostumbrarse a doblar videos en otros idiomas, lo que no tiende a ser el caso de los subtítulos manualmente hechos. Puedes editar los subtítulos y luego guardarlos como un archivo .srt para usarlos como entrada para la herramienta para así dejarle crear un audio o subtítulo en otro idioma.

Creación de subtítulos usando whisper.cpp

A la fecha, 2024, los modelos de inteligencia artificial de Whisper son los modelos de transcripción vocal más avanzados que hay, [1] y se pueden ejecutar localmente, ya sea con Python o whisper.cpp. A diferencia de los modelos anteriores de Vosk, estos sí producen puntuación, lo que hace que sus resultados sean mucho más cercanos a los de una transcripción humana de alta calidad. A pesar de todo, deberías corroborar los subtítulos hechos con inteligencia artificial en base al video original y arreglar errores, agregar puntuación, revisar la escritura de los nombres de la gente y los lugares, comprobar los hechos y cifras, etcétera. Los subtítulos hechos con inteligencia artificial son muy útiles como primer borrador, pero suelen tener algunos errores torpes que ningún transcriptor humano hubiera hecho.

Una de las ventajas de whisper.cpp es su optimización para ejecutarse específicamente en el procesador en lugar de la tarjeta gráfica (por lo que es muy útil si tienes una tarjeta gráfica de AMD y, por ende, no tienes CUDA). A pesar de ello, CUDA y Metal (en Mac) también son compatibles, por lo que puede adaptarse sin problemas a distintos equipos. Otra ventaja es que no depende de la instalación de dependencias externas, es decir, no se necesita ni Python ni PyTorch, ya que está hecho con C++, lo que lo vuelve una descarga más ligera que la de un entorno de aprendizaje automático en Python.

Algunas aplicaciones de edición de video y de subtítulos descriptivos con interfaz gráfica tienen ya integrada la funcionalidad de Whisper: ejemplos de código abierto incluyen el editor de video Kdenlive (desde la versión 23.04; necesita Python) y Subtitle Edit (tanto Python como C++ se pueden usar para ejecutar los modelos de Whisper).

Mas ejecutar la versión de línea de comandos de whisper.cpp para crear un archivo SRT de forma directa tampoco es tan difícil, siempre y cuando tu sistema operativo tenga un compilador de C, make, etc., para poder compilarlo:

Primero, usa, por ejemplo, ffmpeg para extraer la pista de audio de un video y transfórmala a una frecuencia de muestreo de 16 kHz:

ffmpeg -i algún_video.ogv -ar 16000 -ac 1 -c:a pcm_s16le audio.wav

Luego, compila whisper.cpp y descarga un modelo (el modelo básico, que está optimizado para el inglés, pesa unos 140 MB; medio también puede manejar otros idiomas y pesa unos 1.5 GB), y da inicio a la conversión mediante, por ejemplo:

./main -m models/ggml-base.en.bin -f audio.wav -t 8 -pc -osrt

Esto usará ocho núcleos del procesador y creará un archivo SRT llamado audio.wav.srt en el mismo directorio. Durante el reconocimiento las palabras serán identificadas con colores en base a su credibilidad (el verde significa muy creíble y el rojo poco creíble), así que podrás ver rápidamente si el modelo está sufriendo dificultades. Si un modelo más pequeño da resultados inutilizables puedes probar con otro más grande, como medio, el cual será más lento pero dará mejores resultados.

También puedes traducir desde otros idiomas; por ejemplo, añadiendo "-l fr -tr" a las opciones traducirá un audio francés al inglés.

Convertir subtítulos de YouTube al formato de texto sincronizado

Subtítulos SBV

Si exportas el formato SBV de los subtítulos de YouTube puedes usar ffmpeg para pasar el archivo de subtítulo al formato SRT (SubRip), usado por Commons. Este rasgo también resuelve el problema de solapamiento que ocurre comúnmente al pasar los subtítulos de YouTube a Commons.

ffmpeg -fix_sub_duration -i input.sbv output.srt

Subtítulos XML

Las diapositivas de la 10 a la 12 describen la creación de subtítulos en YouTube Creator Studio, la descarga de estos en formato SRT y la publicación de los resultantes a Wikimedia Commons TimedText.

Esta sección explica el cómo convertir los subtítulos XML de YouTube al formato SubRip (srt); el formato de subtítulos de texto sincronizado que se usa en Wikimedia Commons.

Si es que

  • el video de YouTube tiene subtítulos en algún idioma (p. ej., creé este video de YouTube con subtítulos en inglés, ruso y carelio);
  • este video se publicó en Wikimedia Commons (p. ej., este archivo);
  • quieres copiar los subtítulos de YouTube al mismo video en Commons.

Entonces:

  1. Descarga el subtítulo en XML, ingresa el identificador del video de YouTube al final de la dirección: http://video.google.com/timedtext?hl=en&lang=en&v=__youtube_video_ID__
  2. Instala Ruby.
  3. Descarga una aplicación de Ruby para convertir los subtítulos del video desde el formato XML de YouTube al formato de SubRip.
  4. Ejecuta aquella aplicación y convierte el archivo XML a uno .SRT.
  5. Copia y pega los contenidos del archivo .SRT a la página pertinente del video en Wikimedia Commons.

Consejos habituales

Escribe lo que esté en formato SRT; este es un bloque de subtítulo:

1
00:00:20,000 --> 00:00:24,400
aquí van las palabras

Y estos son dos:

1
00:00:20,000 --> 00:00:21,500
más y más palabras

2
00:00:21,500 --> 00:00:24,400
aún más

Si una chica dice más y más palabras a la par que un hombre dice aún más, escribir más y más palabras. aún más sería incorrecto:

―más y más palabras

―aún más

Pero si hay el tiempo suficiente para mostrarlos a ambos en sus propios bloques, entonces eso se debería hacer:más y más palabras y después aún más.

(subtitleedit hará que el bloque se vuelva rojo si es demasiado corto, por lo que sabrás si necesitas juntarlos o no).

De todos modos, cada nuevo personaje o cosa que produzca sonido lleva una raya; por ejemplo, un bebé que llora y da la alarma:

―[bebé llora]

―[suena la alarma]

Pero si estos son lejanos entre sí deberían tener sus propios bloques: [bebé llora] y después [suena la alarma]

Ruidos y tales

Como puedes ver, usamos corchetes para las descripciones sonoras. Se recomienda el uso de corchetes, ya que son lo que más se usa hoy en día, pero en el pasado la gente usaba los paréntesis y ponía el texto en mayúsculas o, en el caso de Friends, [2] usaban espacios y cursiva en paréntesis ( cliqueo ). [3] Sin embargo, su uso es muy inusual hoy en día; no los uses.

Otro método más usado antes era usar NOMBRE: palabras cuando se quería reservar el nombre de la persona junto al uso de paréntesis para los sonidos. En el presente, los corchetes y paréntesis se usan para ambos; algunos usan los paréntesis para los nombres y los corchetes para los sonidos (o viceversa). [4] [5] Pero, ¿por qué?, ¿por qué harías eso? Es más confuso que nada.

Personajes

Escribe lo que diga cada personaje, si hablan muy rápido puede que debas resumir lo que dijeron para que se pueda leer a tiempo. Si no puedes discernir quién está hablando sin el sonido, pon su nombre en corchetes seguido de lo que dijeron: [Elsa] ¡No puedo! Si están fuera de la pantalla o hablando a través del teléfono pon su nombre entre corchetes y lo que digan en cursiva. Si el público no conoce el nombre del personaje hasta el momento, trata de evitar decírselos y solo pon su género o profesión; también puedes sintetizar su nombre; por ejemplo, Capitán Raymond Holt a Ray o Holt. Lo que sea que sirva para que se puedan leer los subtítulos a tiempo.

Si añades el nombre del personaje no lo pongas en cada bloque de subtítulo; solo ponlo en el primero, cuando el personaje empiece a hablar:

[Nombre] palabras, palabras y palabras o [Nombre al teléfono] palabras, palabras y palabras si están al teléfono.

El siguiente bloque no tiene que tener el nombre del personaje:

más palabras

Adición de palabras

Así como puedes resumir lo que dijeron los personajes también puedes adicionar palabras para darles más sentido. Por ejemplo, en el episodio «Caught in the Act» de Modern Family Claire dice ¿Qué pasa? Seguro. Qué vergüenza, pero los subtítulos dicen ¿Qué pasa? Un seguro. Qué vergüenza. Tú decides si quieres agregar palabras o no.

Huecos entre bloques

Si un personaje dice Espera, escucho algo, subtitúlalo como Espera, escucho algo. Si un personaje dice Espera [1.5 segundos], escucho algo, subtitúlalo como Espera para el primer bloque de subtítulo, y después Escucho algo para el siguiente, pero no dejes un hueco entre estos dos a menos que el silencio dure más.

A veces la gente dice Pero... funcionaría mejor así. Los puntos suspensivos duran poco tiempo. Subtitúlalo así: Pero funcionaría mejor así y has que el bloque de subtítulo se muestre en la pantalla apenas escuches el funcionaría. De este modo no se estropea lo que el personaje iba a decir. Si el hueco entre pero y funcionaría es más largo, tal vez 0.6 segundos, escribe pero en su propio bloque de subtítulo y mantenlo en la pantalla hasta que suene funcionaría, luego el siguiente bloque (de forma inmediata, sin hueco) debería decir: funcionaría mejor así.

Cifras y acrónimos

Because all caps is used for things, you shouldn't use it for screaming.

But I have seen Friends use italics for a whole paragraph to really emphasize the yelling. [6]

so thats an option, but I don't see it used anymore.

Use all caps for when someone says an acronym e.g NASA or an initialism e.g ADHD, or though you won't be able to tell if they said each letter (initialism) or not (acronym).

Friends used to combat this problem by putting dots though all initialisms, [7]but this isn't done that much anymore. Made up words that originated form an acronym should also be in caps, e.g in Heartbreak High they go to a class called Sexual Literacy Tutorial but the student's call it "sluts". The subtitles are written as "I'm going to SLT's" even if they say "sluts".

I disagree and would make it say "I'm going to SLUTS." you pick.

If someone says "I paid thirteen dollars" put "I paid $13" if they say "It cost me ten grand but if I asked the other guy it would've been twenty" you can put It cost me $10 000 but if I asked the other guy it would've been $20 000. or It cost me $10 000 but if I asked the other guy it would've been 20. not sure what's better.

If a character is talking about Wikipedia and they say "W P colon mos" put WP:MOS as that's how you type it. But It gets tricky if they say "slash".

In the case of the Brooklyn Nine-Nine Halloween episodes they say "I will be the best detective slash genus." but they subtitled it as "I will be the best detective/genus." even though they said "slash".

The later seasons are subtitled differently and include the word "slash" in the subtitles if they said it, the newer method is recommended.

Italics

A word with a different tone of voice should be in italics especially if they are implying something.

Follow MOS:Italics to know what types of media to put in italics.

If you need to use italics but the character is off screen and there words are already in italics just put what you wanted to put in italics in non-italics (reversed).

Música

La música debería ser rodeada usando el carácter «♪», codificación Unicode U+9834 o Alt+266A. También puedes usar «♫», codificación Unicode U+9835 o Alt+266B; p. ej.:

 1
 00:00:20,000 --> 00:00:24,400
 ♪ rocanrol reproduciéndose en la gramola ♪

You should stop subtitling the music when the characters start talking over it, so the audience can read what the characters are saying.

Lenguaje de marcado

Los únicos lenguajes de marcado compatibles con el formato SRT son:

  • Negrita<b> ... </b>
  • Cursiva<i> ... </i>
  • Subrayado<u> ... </u>

RECORDATORIO: el formateo de Wikicódigo no es compatible.

Localización

Después de que los subtítulos se hayan transcrito a partir del idioma de origen del video a un archivo de texto sincronizado se pueden traducir en otros idiomas así:

  • Abre el archivo de texto sincronizado en el idioma original, por ejemplo, el inglés TimedText:Elephants Dream.ogv.en.srt, en el modo edición y copia toda la página.
  • En la barra de dirección reemplaza el «en» con el código del idioma que prefieras, por ejemplo, «fr», y luego pega el texto original en la página nueva.
  • Ve el video original y después traduce el texto a tu idioma.
  • Tras guardar la página nueva el video con los subtítulos debería cargarse a la página; puedes verlo para examinar la sincronización de los subtítulos.
  • Añade un enlace de categoría a la página de discusión «[[Category:Timed Text in Language Name|Language Name]]». Por ejemplo, mira TimedText talk:Elephants Dream.ogv.fr.srt.

Artículos de Wikipedia acerca de los temas relacionados al texto sincronizado o a los subtítulos

Estos son artículos de ya sea Q844253: texto sincronizado o Q204028: subtítulos.

Enlazar

Esta parte necesita ser expandida.

¿Cómo se asocian los subtítulos descriptivos con los archivos multimedia?

  • Usa las redirecciones para evitar el contenido duplicado, como, por ejemplo, «TimedText:Elephants Dream (high quality).ogv.pt.srt» redirecciona al ya existente «TimedText:Elephants Dream.ogv.pt.srt». Esto se asegura de que el modelo de los subtítulos descriptivos visualice el nombre correcto del archivo de los archivos de subtitulaje (esto podría ser importante para los fragmentos de las películas).
  • El parámetro de «{{Closed captions}}» es una alternativa
  • se requiere más compatibilidad con la herramienta de texto sincronizado;
  • Categorizar: no es posible categorizar la página de texto sincronizado en sí misma, pero la de discusión sí.

Un esquema de categorización posible es:

 [[:Category:File formats]] + [[:Category:Media types]]
                       |
               [[:Category:Timed Text]] + [[:Category:Legend in German]]
                                   | 
                           [[:Category:Timed Text in German]]
 
                                   + [[:Category:Legend in French]]
                                   | 
                           [[:Category:Timed Text in French]]
 
                                   + [[:Category:Legend in English]]
                                   | 
                           [[:Category:Timed Text in English]]

Categorías relacionadas: «Category:Files with closed captioning».

Véase también

References

Category:Timed Text/Translations#%20 Category:Commons features/Translations#Timed%20Text Category:Commons video resources/Translations#Timed%20Text
  1. 1 2 AI Inteligencia artificial.
  2. When I say the people who subtitled Friends I mean the episodes that say [Captioned by The Caption Center WGBH Education Foundation] at the end
  3. Episodio «The One With The Two Parties» de Friends.
  4. Accessibility for the Blind at Disney Sea Tokyo + Hello Kitty World and the Snoopy Museum!
  5. File:Fred Rogers testifies before the Senate Subcommittee on Communications, 1969.ogv
  6. Friends episode "The One With Phoebe's Birthday Dinner"
  7. Friends episode "The One with the Prom Video"
Category:Commons features/Translations Category:Commons video resources/Translations Category:Timed Text/Translations