In [2]:
# %% 
# üîß CONFIGURA√á√ÉO CORRETA PARA DIALOGPT
import os
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
chat_pipeline = None
def setup_dialogpt_correct():
    print("üöÄ Inicializando DialoGPT-medium (configura√ß√£o correta)...")
    
    # Definir dispositivo
    device = "cuda" if torch.cuda.is_available() else "cpu"
    print(f"‚úÖ Dispositivo: {device.upper()}")
    
    # Caminho do modelo
    MODEL_PATH = os.path.join(os.getcwd(), "ml_models", "DialoGPT-medium")
    
    if not os.path.exists(MODEL_PATH):
        print(f"‚ùå Modelo n√£o encontrado em: {MODEL_PATH}")
        return None, None
    
    try:
        # Carregar tokenizer
        tokenizer = AutoTokenizer.from_pretrained(
            MODEL_PATH,
            local_files_only=True
        )
        
        # ‚úÖ CONFIGURA√á√ÉO ESSENCIAL PARA DIALOGPT
        tokenizer.pad_token = tokenizer.eos_token
        
        # Carregar modelo
        model = AutoModelForCausalLM.from_pretrained(
            MODEL_PATH,
            dtype=torch.float32,
            device_map="auto" if torch.cuda.is_available() else None,
            local_files_only=True
        )
        
        # ‚úÖ PIPELINE CORRETO PARA MODELOS CONVERSAcionAIS
        chat_pipeline = pipeline(
            "text-generation",
            model=model,
            tokenizer=tokenizer,
            dtype=torch.float32,
            device=0 if torch.cuda.is_available() else -1,
            pad_token_id=tokenizer.eos_token_id
        )
        
        print("‚úÖ DialoGPT-medium configurado corretamente!")
        return chat_pipeline, tokenizer
        
    except Exception as e:
        print(f"‚ùå Erro na configura√ß√£o: {str(e)}")
        return None, None

# Inicializar corretamente
chat_pipeline, tokenizer = setup_dialogpt_correct()

üöÄ Inicializando DialoGPT-medium (configura√ß√£o correta)...
‚úÖ Dispositivo: CPU


Device set to use cpu


‚úÖ DialoGPT-medium configurado corretamente!


In [6]:
# %%
# üí¨ CHAT INTERATIVO CORRIGIDO
def chat_dialogpt_fixed():
    if chat_pipeline is None:
        print("‚ùå Modelo n√£o inicializado.")
        return
    
    print("\n" + "ü§ñ CHAT DIALOGPT CORRIGIDO" + "="*50)
    print("Digite sua mensagem ou 'quit' para sair")
    print("="*50)
    
    # Hist√≥rico de conversa no formato correto para DialoGPT
    conversation_history = []
    
    while True:
        try:
            user_input = input("\nüë§ Voc√™: ").strip()
            
            if user_input.lower() in ['quit', 'sair', 'exit']:
                print("üëã At√© logo!")
                break
            
            # ‚úÖ FORMATO CORRETO PARA DIALOGPT
            if conversation_history:
                # Juntar hist√≥rico de conversa
                full_prompt = "\n".join(conversation_history[-4:]) + f"\nUser: {user_input}\nBot:"
            else:
                full_prompt = f"User: {user_input}\nBot:"
            
            print("‚è≥ Gerando resposta...")
            
            # ‚úÖ CONFIGURA√á√ïES OTIMIZADAS PARA DIALOGPT
            response = chat_pipeline(
                full_prompt,
                max_new_tokens=150,
                temperature=0.7,  # Reduzir temperatura para respostas mais coerentes
                top_p=0.9,
                do_sample=True,
                num_return_sequences=1,
                pad_token_id=tokenizer.eos_token_id,
                repetition_penalty=1.2,  # Penalizar repeti√ß√µes
                return_full_text=False
            )
            
            if response and len(response) > 0:
                generated_text = response[0]['generated_text'].strip()
                
                # Limpar a resposta
                if "Bot:" in generated_text:
                    generated_text = generated_text.split("Bot:")[-1].strip()
                
                # Remover repeti√ß√µes do prompt
                if user_input in generated_text:
                    generated_text = generated_text.replace(user_input, "").strip()
                
                # Garantir que temos uma resposta
                if not generated_text or len(generated_text) < 2:
                    generated_text = "Desculpe, n√£o consegui gerar uma resposta adequada."
                    
            else:
                generated_text = "Erro na gera√ß√£o da resposta."
            
            # Adicionar ao hist√≥rico
            conversation_history.append(f"User: {user_input}")
            conversation_history.append(f"Bot: {generated_text}")
            
            # Manter hist√≥rico limitado
            if len(conversation_history) > 8:
                conversation_history = conversation_history[-8:]
            
            print(f"\nü§ñ Bot: {generated_text}")
            
            # Estat√≠sticas
            input_tokens = len(tokenizer.encode(full_prompt))
            output_tokens = len(tokenizer.encode(generated_text))
            print(f"üìä Tokens: {input_tokens} (entrada) + {output_tokens} (sa√≠da)")
            
        except KeyboardInterrupt:
            print("\nüõë Chat interrompido")
            break
        except Exception as e:
            print(f"‚ùå Erro: {str(e)}")
            # Continuar mesmo com erro

# Executar chat corrigido
if chat_pipeline is not None:
    chat_dialogpt_fixed()


Digite sua mensagem ou 'quit' para sair



üë§ Voc√™:  Generate 5 questions about programming languages


‚è≥ Gerando resposta...

ü§ñ Bot: 10
üìä Tokens: 12 (entrada) + 1 (sa√≠da)



üë§ Voc√™:  name 7 programming languages


‚è≥ Gerando resposta...

ü§ñ Bot: Desculpe, n√£o consegui gerar uma resposta adequada.
üìä Tokens: 23 (entrada) + 18 (sa√≠da)



üë§ Voc√™:  write a simple verse


‚è≥ Gerando resposta...

ü§ñ Bot: n o
üìä Tokens: 51 (entrada) + 2 (sa√≠da)



üë§ Voc√™:  quit


üëã At√© logo!


In [4]:
# %%
# üß™ TESTE DE QUIZ SIMPLIFICADO
def test_quiz_simple():
    if chat_pipeline is None:
        return
    
    print("üß™ TESTE DE QUIZ SIMPLIFICADO")
    print("=" * 50)
    
    # ‚úÖ PROMPTS MAIS SIMPLES E DIRETOS
    test_prompts = [
        "Crie uma pergunta de m√∫ltipla escolha sobre Python com 4 op√ß√µes.",
        "Fa√ßa uma pergunta sobre machine learning com alternativas A, B, C, D.",
        "Gere uma quest√£o de programa√ß√£o com op√ß√µes de resposta."
    ]
    
    for i, prompt in enumerate(test_prompts, 1):
        print(f"\nüéØ Teste {i}: {prompt}")
        print("-" * 40)
        
        try:
            response = chat_pipeline(
                prompt,
                max_new_tokens=100,
                temperature=0.8,
                do_sample=True,
                num_return_sequences=1
            )
            
            if response and len(response) > 0:
                result = response[0]['generated_text'].strip()
                print(f"üìù Resposta: {result}")
            else:
                print("‚ùå Nenhuma resposta")
                
        except Exception as e:
            print(f"‚ùå Erro: {str(e)}")

# Executar teste
if chat_pipeline is not None:
    test_quiz_simple()

üß™ TESTE DE QUIZ SIMPLIFICADO

üéØ Teste 1: Crie uma pergunta de m√∫ltipla escolha sobre Python com 4 op√ß√µes.
----------------------------------------
üìù Resposta: Crie uma pergunta de m√∫ltipla escolha sobre Python com 4 op√ß√µes.py

üéØ Teste 2: Fa√ßa uma pergunta sobre machine learning com alternativas A, B, C, D.
----------------------------------------
üìù Resposta: Fa√ßa uma pergunta sobre machine learning com alternativas A, B, C, D.E, R, and...

üéØ Teste 3: Gere uma quest√£o de programa√ß√£o com op√ß√µes de resposta.
----------------------------------------
üìù Resposta: Gere uma quest√£o de programa√ß√£o com op√ß√µes de resposta.Sim se que nada pra dar uma vontade de esta anest rica. Muito obrigado


In [5]:
# %%
# üîç VERIFICA√á√ÉO DO MODELO
def verify_model():
    print("üîç VERIFICANDO CONFIGURA√á√ÉO DO MODELO")
    print("=" * 50)
    
    if chat_pipeline is None:
        print("‚ùå Pipeline n√£o inicializado")
        return
    
    try:
        # Teste b√°sico
        test_prompt = "Ol√°, como voc√™ est√°?"
        response = chat_pipeline(
            test_prompt,
            max_new_tokens=50,
            temperature=0.7,
            do_sample=True,
            num_return_sequences=1
        )
        
        print(f"‚úÖ Modelo respondeu: {response[0]['generated_text'][:100]}...")
        print("üéØ Modelo est√° funcionando!")
        
    except Exception as e:
        print(f"‚ùå Erro no teste: {str(e)}")

if chat_pipeline is not None:
    verify_model()

üîç VERIFICANDO CONFIGURA√á√ÉO DO MODELO
‚úÖ Modelo respondeu: Ol√°, como voc√™ est√°?...
üéØ Modelo est√° funcionando!


In [9]:
# %%
# üîç VERIFICA√á√ÉO COMPLETA DO MODELO
def deep_model_check():
    print("üîç VERIFICA√á√ÉO PROFUNDA DO MODELO")
    print("=" * 60)
    
    MODEL_PATH = os.path.join(os.getcwd(), "ml_models", "DialoGPT-medium")
    
    # Verificar arquivos do modelo
    print("üìÅ Verificando arquivos do modelo...")
    required_files = ['config.json', 'pytorch_model.bin', 'tokenizer_config.json']
    for file in required_files:
        file_path = os.path.join(MODEL_PATH, file)
        if os.path.exists(file_path):
            print(f"‚úÖ {file}: {os.path.getsize(file_path) / (1024*1024):.1f} MB")
        else:
            print(f"‚ùå {file}: AUSENTE")
    
    # Testar tokenizer
    print("\nüî§ Testando tokenizer...")
    try:
        test_text = "Hello, how are you?"
        tokens = tokenizer.encode(test_text)
        print(f"‚úÖ Tokenizer funciona: '{test_text}' ‚Üí {len(tokens)} tokens")
        print(f"   Tokens: {tokens}")
    except Exception as e:
        print(f"‚ùå Erro no tokenizer: {e}")
    
    # Teste direto do modelo
    print("\nüß™ Teste direto do modelo...")
    try:
        # Preparar input
        input_text = "User: What is Python?\nBot:"
        inputs = tokenizer.encode(input_text, return_tensors="pt")
        
        # Gerar
        with torch.no_grad():
            outputs = model.generate(
                inputs,
                max_new_tokens=50,
                temperature=0.8,
                do_sample=True,
                pad_token_id=tokenizer.eos_token_id
            )
        
        generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
        print(f"‚úÖ Gera√ß√£o direta: {generated_text}")
        
    except Exception as e:
        print(f"‚ùå Erro na gera√ß√£o direta: {e}")

if 'model' in locals() and 'tokenizer' in locals():
    deep_model_check()

In [10]:
 deep_model_check()

üîç VERIFICA√á√ÉO PROFUNDA DO MODELO
üìÅ Verificando arquivos do modelo...
‚úÖ config.json: 0.0 MB
‚úÖ pytorch_model.bin: 823.0 MB
‚úÖ tokenizer_config.json: 0.0 MB

üî§ Testando tokenizer...
‚úÖ Tokenizer funciona: 'Hello, how are you?' ‚Üí 6 tokens
   Tokens: [15496, 11, 703, 389, 345, 30]

üß™ Teste direto do modelo...
‚ùå Erro na gera√ß√£o direta: name 'model' is not defined
