Spaces:

BugZoid
/

text-humanizer

Running

App Files Files Community

BugZoid commited on Jan 11

Commit

8bf558e

verified ·

1 Parent(s): b564db7

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -19

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import streamlit as st
 from transformers import (
     AutoTokenizer,
-    AutoModelForSeq2SeqLM,  # Correção aqui
     T5ForConditionalGeneration,
     T5Tokenizer
 )
@@ -25,16 +25,18 @@ def paraphrase_text(text):
     inputs = st.session_state.paraphrase_tokenizer.encode(
         text,
         return_tensors="pt",
-        max_length=512,
         truncation=True
     )
     outputs = st.session_state.paraphrase_model.generate(
         inputs,
-        max_length=512,
         do_sample=True,
-        temperature=0.7,
-        top_p=0.9
     )
     return st.session_state.paraphrase_tokenizer.decode(outputs[0], skip_special_tokens=True)
@@ -43,21 +45,30 @@ def humanize_text(text):
     """
     Humanize the input text using T5 model
     """
     input_ids = st.session_state.t5_tokenizer(
-        f"humanize: {text}",
         return_tensors="pt",
-        max_length=512,
         truncation=True
     ).input_ids
     outputs = st.session_state.t5_model.generate(
         input_ids,
-        max_length=len(text) + 100,  # Dynamic length based on input
         do_sample=True,
-        temperature=0.7,  # Increased creativity
-        top_p=0.9,       # Nucleus sampling
-        num_beams=4,     # Beam search for better quality
-        no_repeat_ngram_size=2  # Avoid repetition
     )
     return st.session_state.t5_tokenizer.decode(outputs[0], skip_special_tokens=True)
@@ -65,24 +76,24 @@ def humanize_text(text):
 # UI Components
 st.set_page_config(page_title="Advanced Text Humanizer", page_icon="🤖")
-st.title("🤖 → 🧑 Advanced Text Humanizer")
 st.markdown("""
-This app transforms robotic text into more natural, human-like language using
-advanced AI models. It combines T5 and BART models for better results.
 """)
 # Input area with expanded capabilities
 input_text = st.text_area(
     "Cole seu texto de robô aqui:",
     height=150,
-    help="Paste your text here to transform it into a more natural, human-like version."
 )
 # Advanced settings in sidebar
 with st.sidebar:
-    st.header("Advanced Settings")
-    use_paraphrase = st.checkbox("Enable Paraphrasing", value=True)
-    show_original = st.checkbox("Show Original Text", value=False)
 # Process button with error handling
 if st.button("Humanizar", type="primary"):

 import streamlit as st
 from transformers import (
     AutoTokenizer,
+    AutoModelForSeq2SeqLM,
     T5ForConditionalGeneration,
     T5Tokenizer
 )
     inputs = st.session_state.paraphrase_tokenizer.encode(
         text,
         return_tensors="pt",
+        max_length=1024,  # Aumentado para textos maiores
         truncation=True
     )
     outputs = st.session_state.paraphrase_model.generate(
         inputs,
+        max_length=1024,
+        min_length=len(text.split()) - 10,  # Garante tamanho mínimo próximo ao original
         do_sample=True,
+        temperature=0.3,  # Reduzido para manter mais fiel ao original
+        top_p=0.95,      # Aumentado para mais diversidade controlada
+        repetition_penalty=1.2  # Evita repetições
     )
     return st.session_state.paraphrase_tokenizer.decode(outputs[0], skip_special_tokens=True)
     """
     Humanize the input text using T5 model
     """
+    # Modificado o prompt para enfatizar português e manter o contexto
+    prompt = (
+        f"reescreva o seguinte texto em português de forma mais natural e humana, "
+        f"mantendo todas as informações originais: {text}"
+    )
     input_ids = st.session_state.t5_tokenizer(
+        prompt,
         return_tensors="pt",
+        max_length=1024,
         truncation=True
     ).input_ids
     outputs = st.session_state.t5_model.generate(
         input_ids,
+        max_length=1024,
+        min_length=len(text.split()) - 10,  # Garante tamanho mínimo próximo ao original
         do_sample=True,
+        temperature=0.3,  # Reduzido para manter mais fiel ao original
+        top_p=0.95,      # Aumentado para mais diversidade controlada
+        num_beams=5,     # Aumentado para melhor qualidade
+        no_repeat_ngram_size=3,  # Evita repetições de trigramas
+        repetition_penalty=1.2,  # Penalidade para repetições
+        length_penalty=1.0   # Incentiva manter o tamanho similar
     )
     return st.session_state.t5_tokenizer.decode(outputs[0], skip_special_tokens=True)
 # UI Components
 st.set_page_config(page_title="Advanced Text Humanizer", page_icon="🤖")
+st.title("🤖 → 🧑 Humanizador de Texto Avançado")
 st.markdown("""
+Este aplicativo transforma textos robotizados em linguagem mais natural e humana,
+mantendo todas as informações originais.
 """)
 # Input area with expanded capabilities
 input_text = st.text_area(
     "Cole seu texto de robô aqui:",
     height=150,
+    help="Cole seu texto aqui para transformá-lo em uma versão mais natural e humana."
 )
 # Advanced settings in sidebar
 with st.sidebar:
+    st.header("Configurações Avançadas")
+    use_paraphrase = st.checkbox("Ativar Paráfrase", value=True)
+    show_original = st.checkbox("Mostrar Texto Original", value=False)
 # Process button with error handling
 if st.button("Humanizar", type="primary"):