Spaces:

TaahKay
/

English_accent_detection

Running

App Files Files Community

TaahKay commited on 11 days ago

Commit

cdcbae9

verified ·

1 Parent(s): 6d20493

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -14

app.py CHANGED Viewed

@@ -19,7 +19,7 @@ from models.custom_interface import CustomEncoderWav2vec2Classifier
-st.title("🎙️ English Accent Audio Detector")
 # Initialize session state
 initialize_session_state()
@@ -36,7 +36,7 @@ if 'whisper' not in st.session_state:
 display_memory_once()
 # Reset state for a new analysis
-if st.button("🔄 Analyze new video"):
     reset_session_state_except_model()
     st.rerun()
@@ -54,7 +54,7 @@ if option == "Upload video file":
         with open(temp_video_path.name, "wb") as f:
             f.write(uploaded_video.read())
         audio_path = trim_video(temp_video_path.name)
-        st.success("✅ Video uploaded successfully.")
         st.session_state.audio_path = audio_path
@@ -65,18 +65,18 @@ elif option == "Enter Video Url":
             audio_path = download_audio_as_wav(yt_url)
             audio_path = trim_audio(audio_path)
         if audio_path:
-            st.success("✅ Video downloaded successfully.")
             st.session_state.audio_path = audio_path
 # Transcription and Accent Analysis
 if st.session_state.audio_path and not st.session_state.transcription:
-    if st.button("🎧 Extract Audio"):
         st.session_state.audio_ready = True
         st.audio(st.session_state.audio_path, format='audio/wav')
         mem = psutil.virtual_memory()
-        st.write(f"🔍 Memory used: {mem.percent}%")
         #Detect Language AND FILTER OUT NON-ENGLISH AUDIOS FOR ANALYSIS
         segments, info = st.session_state.whisper.transcribe(st.session_state.audio_path, beam_size=1)
@@ -85,34 +85,34 @@ if st.session_state.audio_path and not st.session_state.transcription:
         if info.language != "en":
-            st.error("❌ This video does not appear to be in English. Please provide a clear English video.")
         else:
             # Show transcription for audio
             with st.spinner("Transcribing audio..."):
                 st.markdown(" Transcript Preview")
                 st.markdown(st.session_state.transcription)
-                st.success("🎵 Audio extracted and ready for analysis!")
                 mem = psutil.virtual_memory()
-                st.write(f"🔍 Memory used: {mem.percent}%")
 if st.session_state.transcription:
     if st.button("🗣️ Analyze Accent"):
-        with st.spinner("🔍 Analyzing accent..."):
             try:
                 mem = psutil.virtual_memory()
-                st.write(f"🔍 Memory used: {mem.percent}%")
                 waveform, sample_rate = torchaudio.load(st.session_state.audio_path)
                 readable_accent, confidence = analyze_accent(waveform, sample_rate, st.session_state.classifier)
                 if readable_accent:
-                    st.success(f"✅ Accent Detected: **{readable_accent}**")
-                    st.info(f"📊 Confidence: {confidence}%")
                 else:
                     st.warning("Could not determine accent.")
             except Exception as e:
-                st.error("❌ Failed to analyze accent.")
                 st.code(str(e))

+st.title("English Accent Audio Detector")
 # Initialize session state
 initialize_session_state()
 display_memory_once()
 # Reset state for a new analysis
+if st.button("Analyze new video"):
     reset_session_state_except_model()
     st.rerun()
         with open(temp_video_path.name, "wb") as f:
             f.write(uploaded_video.read())
         audio_path = trim_video(temp_video_path.name)
+        st.success("Video uploaded successfully.")
         st.session_state.audio_path = audio_path
             audio_path = download_audio_as_wav(yt_url)
             audio_path = trim_audio(audio_path)
         if audio_path:
+            st.success("Video downloaded successfully.")
             st.session_state.audio_path = audio_path
 # Transcription and Accent Analysis
 if st.session_state.audio_path and not st.session_state.transcription:
+    if st.button("Extract Audio"):
         st.session_state.audio_ready = True
         st.audio(st.session_state.audio_path, format='audio/wav')
         mem = psutil.virtual_memory()
+        st.write(f"Memory used: {mem.percent}%")
         #Detect Language AND FILTER OUT NON-ENGLISH AUDIOS FOR ANALYSIS
         segments, info = st.session_state.whisper.transcribe(st.session_state.audio_path, beam_size=1)
         if info.language != "en":
+            st.error("This video does not appear to be in English. Please provide a clear English video.")
         else:
             # Show transcription for audio
             with st.spinner("Transcribing audio..."):
                 st.markdown(" Transcript Preview")
                 st.markdown(st.session_state.transcription)
+                st.success("Audio extracted and ready for analysis!")
                 mem = psutil.virtual_memory()
+                st.write(f"Memory used: {mem.percent}%")
 if st.session_state.transcription:
     if st.button("🗣️ Analyze Accent"):
+        with st.spinner("Analyzing accent..."):
             try:
                 mem = psutil.virtual_memory()
+                st.write(f"Memory used: {mem.percent}%")
                 waveform, sample_rate = torchaudio.load(st.session_state.audio_path)
                 readable_accent, confidence = analyze_accent(waveform, sample_rate, st.session_state.classifier)
                 if readable_accent:
+                    st.success(f"Accent Detected: **{readable_accent}**")
+                    st.info(f"Confidence: {confidence}%")
                 else:
                     st.warning("Could not determine accent.")
             except Exception as e:
+                st.error("Failed to analyze accent.")
                 st.code(str(e))