import gradio as gr import google.generativeai as genai import os import re from youtube_transcript_api import YouTubeTranscriptApi from youtube_transcript_api._errors import TranscriptsDisabled, NoTranscriptFound # --- Configuration --- KEY_FROM_ENV = os.environ.get("GEMINI_API_KEY") def extract_video_id(url): """Extracts video ID from various YouTube URL formats.""" patterns = [ r'(?:v=|\/)([0-9A-Za-z_-]{11}).*', r'(?:youtu\.be\/)([0-9A-Za-z_-]{11})', ] for pattern in patterns: match = re.search(pattern, url) if match: return match.group(1) return None def get_transcript(video_id): """ Fetches the transcript using YouTube's built-in captions. This does NOT require downloading audio! """ try: # Try to get transcript - will try available languages automatically # First try Turkish, then English, then any languages_to_try = ['tr', 'en'] try: transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=languages_to_try) lang_code = 'tr/en' except: # Fallback: get any available transcript transcript = YouTubeTranscriptApi.get_transcript(video_id) lang_code = 'auto' full_text = " ".join([item['text'] for item in transcript]) return full_text, lang_code except TranscriptsDisabled: raise Exception("Bu videoda altyazılar devre dışı bırakılmış.") except Exception as e: raise Exception(f"Altyazı alınamadı: {str(e)}") def analyze_video(url, api_key_input): """Main pipeline function.""" api_key = KEY_FROM_ENV if KEY_FROM_ENV else api_key_input try: if not api_key: return "HATA: API anahtarı bulunamadı. Lütfen ayarlardan ekleyin veya kutucuğa girin." if not url: return "HATA: Lütfen bir YouTube linki girin." # 1. Extract Video ID video_id = extract_video_id(url) if not video_id: return "HATA: Geçersiz YouTube linki. Lütfen kontrol edin." print(f"Video ID: {video_id}") # 2. Get Transcript (NO AUDIO DOWNLOAD NEEDED!) print("Fetching transcript...") transcript_text, lang_code = get_transcript(video_id) if not transcript_text: return "HATA: Bu video için altyazı bulunamadı. Lütfen altyazısı olan bir video deneyin." print(f"Transcript fetched ({lang_code}): {len(transcript_text)} chars") # 3. Intelligence (Gemini) print("Analyzing with Gemini...") genai.configure(api_key=api_key) generation_config = { "temperature": 0.7, "top_p": 0.95, "top_k": 64, "max_output_tokens": 8192, } safety_settings = [ {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}, {"category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}, {"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}, {"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}, ] gemini_model = genai.GenerativeModel(model_name="gemini-1.5-flash", generation_config=generation_config, safety_settings=safety_settings) prompt = f""" Sen uzman bir video analistisin. Aşağıdaki metni (ki bu bir video altyazısıdır) analiz et. Bana şunları ver: 1) Videonun kısa bir özeti 2) Ana fikirler (Madde madde) 3) Videonun tonu ve amacı Yanıtın tamamen TÜRKÇE olsun. Eğer altyazı başka bir dildeyse, önce Türkçeye çevir sonra analiz et. ALTYAZI METNİ: {transcript_text} """ response = gemini_model.generate_content(prompt) return response.text except Exception as e: return f"BİR HATA OLUŞTU:\n{str(e)}" # --- Gradio UI --- with gr.Blocks() as demo: gr.Markdown( """ # 🎥 YouTube Yapay Zeka Analisti **Videonun özetini ve ana fikirlerini saniyeler içinde çıkarın.** *Not: Bu uygulama YouTube'un mevcut altyazılarını kullanır. Altyazısı olmayan videolar analiz edilemez.* """ ) with gr.Row(): with gr.Column(): url_input = gr.Textbox(label="YouTube Video Linki", placeholder="https://www.youtube.com/watch?v=...") if KEY_FROM_ENV: api_key_input = gr.Textbox(label="Gemini API Anahtarı", value="Sistemde Tanımlı ✅", interactive=False) else: api_key_input = gr.Textbox(label="Gemini API Anahtarı", type="password", placeholder="Anahtarınızı girin") analyze_btn = gr.Button("Analiz Et 🚀", variant="primary") with gr.Column(): output_area = gr.Markdown(label="Analiz Sonucu") analyze_btn.click( fn=analyze_video, inputs=[url_input, api_key_input], outputs=output_area, show_progress=True ) if __name__ == "__main__": demo.launch()