Auto-Translation

Sleeping

App Files Files Community

DonWare commited on Oct 4, 2025

Commit

5d11056

verified ·

1 Parent(s): 1b9a050

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -9

app.py CHANGED Viewed

@@ -1,7 +1,8 @@
 from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
 import torch
-# Selecciona el dispositivo (GPU si está disponible, sino CPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Cargar modelo y tokenizer
@@ -9,18 +10,45 @@ model_name = "facebook/mbart-large-50"
 tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
 model = MBartForConditionalGeneration.from_pretrained(model_name).to(device)
-def traducir(texto, idioma_destino="es_XX"):
     """
-    Traduce texto a un idioma objetivo usando mBART-50.
-    idioma_destino: código de idioma HuggingFace (ej: 'es_XX', 'en_XX', 'fr_XX')
     """
-    tokenizer.src_lang = "en_XX"  # Idioma de origen (puedes detectar con langdetect si quieres)
     encoded = tokenizer(texto, return_tensors="pt").to(device)
-    generated_tokens = model.generate(**encoded, forced_bos_token_id=tokenizer.lang_code_to_id[idioma_destino])
     traduccion = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
     return traduccion
-# Ejemplo de uso
-texto = "Hello, how are you?"
-print(traducir(texto, idioma_destino="es_XX"))  # Salida: "Hola, ¿cómo estás?"

+import gradio as gr
 from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
 import torch
+# Dispositivo: GPU si está disponible, sino CPU
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Cargar modelo y tokenizer
 tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
 model = MBartForConditionalGeneration.from_pretrained(model_name).to(device)
+# Lista de idiomas disponibles
+idiomas = {
+    "Inglés": "en_XX",
+    "Español": "es_XX",
+    "Francés": "fr_XX",
+    "Alemán": "de_XX",
+    "Ruso": "ru_RU",
+    "Chino": "zh_CN",
+    "Árabe": "ar_AR"
+}
+def traducir(texto, idioma_origen, idioma_destino):
     """
+    Traduce texto de un idioma a otro usando mBART-50.
     """
+    if not texto.strip():
+        return "Por favor ingresa algún texto."
+    tokenizer.src_lang = idioma_origen
     encoded = tokenizer(texto, return_tensors="pt").to(device)
+    generated_tokens = model.generate(
+        **encoded,
+        forced_bos_token_id=tokenizer.lang_code_to_id[idioma_destino]
+    )
     traduccion = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
     return traduccion
+# Crear interfaz Gradio
+iface = gr.Interface(
+    fn=traducir,
+    inputs=[
+        gr.Textbox(label="Texto a traducir", placeholder="Escribe aquí tu texto...", lines=4),
+        gr.Dropdown(label="Idioma de origen", choices=list(idiomas.values()), value="en_XX"),
+        gr.Dropdown(label="Idioma de destino", choices=list(idiomas.values()), value="es_XX")
+    ],
+    outputs=gr.Textbox(label="Traducción"),
+    title="Traductor mBART-50",
+    description="Traduce texto entre múltiples idiomas usando mBART-50."
+)
+# Ejecutar interfaz
+iface.launch()