fgdigitalvisitingcard

Paused

App Files Files Community

Spanicin commited on Nov 18, 2025

Commit

e1d177a

verified ·

1 Parent(s): 6215614

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -5

app.py CHANGED Viewed

@@ -191,15 +191,40 @@ def custom_cleanup(temp_dir, exclude_dir):
                 print(f"Failed to delete {file_path}. Reason: {e}")
-def generate_audio(voice_cloning, voice_gender, text_prompt,user_voice_path):
     print("generate_audio")
     if voice_cloning == 'no':
         if voice_gender == 'male':
             voice = 'echo'
             print('Entering Audio creation using elevenlabs')
             set_api_key('sk_e823e586aa0c238fdfae02466faad9472bb668fd04431fca')
-            audio = generate(text = text_prompt, voice = "Daniel", model = "eleven_multilingual_v2",stream=True, latency=4)
             with tempfile.NamedTemporaryFile(suffix=".mp3", prefix="text_to_speech_",dir=TEMP_DIR.name, delete=False) as temp_file:
                 for chunk in audio:
                     temp_file.write(chunk)
@@ -234,7 +259,16 @@ def generate_audio(voice_cloning, voice_gender, text_prompt,user_voice_path):
         # voice = Voice(voice_id="DeZH4ash9IU9gUcNjVXh",name="Marc",settings=VoiceSettings(
                         # stability=0.71, similarity_boost=0.9, style=0.0, use_speaker_boost=True),)
-        audio = generate(text = text_prompt, voice = voice, model = "eleven_multilingual_v2",stream=True, latency=4)
         with tempfile.NamedTemporaryFile(suffix=".mp3", prefix="cloned_audio_",dir=TEMP_DIR.name, delete=False) as temp_file:
             for chunk in audio:
                 temp_file.write(chunk)
@@ -275,8 +309,10 @@ def generate_video():
             # image_path = '/home/user/app/images/marc_smile_enhanced.jpg'    old code
             # source_image = Image.open(image_path) old code
             text_prompt = request.form['text_prompt']
             print('Input text prompt: ',text_prompt)
             text_prompt = text_prompt.strip()
             if not text_prompt:
                 return jsonify({'error': 'Input text prompt cannot be blank'}), 400
@@ -313,7 +349,7 @@ def generate_video():
             source_image = request.files['source_image']
             source_image_path = save_uploaded_file(source_image, source_image.filename, TEMP_DIR)
             print(f"Source image saved at: {source_image_path}")
-            driven_audio_path = generate_audio(voice_cloning, voice_gender, text_prompt,user_voice_path)
             #driven_audio_path_not_use = user_voice_path
             print(f"driven audio path: {driven_audio_path}")
             save_dir = tempfile.mkdtemp(dir=TEMP_DIR.name)

                 print(f"Failed to delete {file_path}. Reason: {e}")
+def generate_audio(voice_cloning, voice_gender, text_prompt,user_voice_path,language):
     print("generate_audio")
+    # Map language → ElevenLabs voice/language codes
+    language_mapping = {
+        "en": "en-IN",  # Indian English
+        "hi": "hi-IN",  # Hindi
+        "ta": "ta-IN",  # Tamil
+        "te": "te-IN",  # Telugu
+        "ml": "ml-IN",  # Malayalam
+        "bn": "bn-IN",  # Bengali
+        "gu": "gu-IN",  # Gujarati
+        "mr": "mr-IN",  # Marathi
+        "kn": "kn-IN",  # Kannada
+    }
+    selected_language = language_mapping.get(language, "en-IN")
+    print("TTS Language Selected:", selected_language)
     if voice_cloning == 'no':
         if voice_gender == 'male':
             voice = 'echo'
             print('Entering Audio creation using elevenlabs')
             set_api_key('sk_e823e586aa0c238fdfae02466faad9472bb668fd04431fca')
+            #audio_old = generate(text = text_prompt, voice = "Daniel", model = "eleven_multilingual_v2",stream=True, latency=4)
+            audio = generate(
+                text=text_prompt,
+                voice="Daniel",
+                model="eleven_multilingual_v2",
+                stream=True,
+                latency=4,
+                language=selected_language
+            )
             with tempfile.NamedTemporaryFile(suffix=".mp3", prefix="text_to_speech_",dir=TEMP_DIR.name, delete=False) as temp_file:
                 for chunk in audio:
                     temp_file.write(chunk)
         # voice = Voice(voice_id="DeZH4ash9IU9gUcNjVXh",name="Marc",settings=VoiceSettings(
                         # stability=0.71, similarity_boost=0.9, style=0.0, use_speaker_boost=True),)
+        #audio_old = generate(text = text_prompt, voice = voice, model = "eleven_multilingual_v2",stream=True, latency=4)
+        audio = generate(
+            text=text_prompt,
+            voice=voice,
+            model="eleven_multilingual_v2",
+            stream=True,
+            latency=4,
+            language=selected_language
+        )
         with tempfile.NamedTemporaryFile(suffix=".mp3", prefix="cloned_audio_",dir=TEMP_DIR.name, delete=False) as temp_file:
             for chunk in audio:
                 temp_file.write(chunk)
             # image_path = '/home/user/app/images/marc_smile_enhanced.jpg'    old code
             # source_image = Image.open(image_path) old code
             text_prompt = request.form['text_prompt']
             print('Input text prompt: ',text_prompt)
+            language = request.form.get('language', 'en')  # default English
+            print("Selected language:", language)
             text_prompt = text_prompt.strip()
             if not text_prompt:
                 return jsonify({'error': 'Input text prompt cannot be blank'}), 400
             source_image = request.files['source_image']
             source_image_path = save_uploaded_file(source_image, source_image.filename, TEMP_DIR)
             print(f"Source image saved at: {source_image_path}")
+            driven_audio_path = generate_audio(voice_cloning, voice_gender, text_prompt,user_voice_path,language)
             #driven_audio_path_not_use = user_voice_path
             print(f"driven audio path: {driven_audio_path}")
             save_dir = tempfile.mkdtemp(dir=TEMP_DIR.name)