Spaces:

Athspi
/

Gysyeysg

Sleeping

Athspi commited on 23 days ago

Commit

36b9aca

verified ·

1 Parent(s): a12d4b6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,10 @@
-  import os
 import json
 import base64
 import requests
-from flask import Flask, request, send_file
-app = Flask(__name__)
 API_KEY = os.getenv("GEMINI_API_KEY")
 API_URL = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-tts:generateContent"
@@ -35,23 +34,30 @@ def generate_audio(text):
     response = requests.post(API_URL, headers=headers, data=json.dumps(payload))
     if response.status_code != 200:
-        raise Exception(f"API Error: {response.text}")
     res_json = response.json()
     data = res_json["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
     audio_bytes = base64.b64decode(data)
-    output_path = "out.wav"
-    with open(output_path, "wb") as f:
         f.write(audio_bytes)
-    return output_path
-@app.route("/speak", methods=["POST"])
-def speak():
-    text = request.json.get("text", "Have a wonderful day!")
-    output_path = generate_audio(text)
-    return send_file(output_path, mimetype="audio/wav")
 if __name__ == "__main__":
-    app.run(host="0.0.0.0", port=7860)

+import os
 import json
 import base64
 import requests
+import gradio as gr
+# Load API key from Hugging Face secret
 API_KEY = os.getenv("GEMINI_API_KEY")
 API_URL = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-tts:generateContent"
     response = requests.post(API_URL, headers=headers, data=json.dumps(payload))
     if response.status_code != 200:
+        return f"API Error: {response.text}"
     res_json = response.json()
     data = res_json["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
     audio_bytes = base64.b64decode(data)
+    file_path = "output.wav"
+    with open(file_path, "wb") as f:
         f.write(audio_bytes)
+    return file_path
+# Gradio Interface
+def speak_gradio(text):
+    result = generate_audio(text)
+    return result if result.endswith(".wav") else None
+iface = gr.Interface(
+    fn=speak_gradio,
+    inputs=gr.Textbox(label="Enter text to speak", placeholder="Say something cheerful..."),
+    outputs=gr.Audio(label="Gemini TTS Output", type="filepath"),
+    title="Gemini TTS (Kore Voice)",
+    description="Powered by Gemini 2.5 Flash Preview TTS API. Cheerfully speaks your input!"
+)
 if __name__ == "__main__":
+    iface.launch()