Spaces:

alon-albalak
/

collaborative-decoding

Sleeping

Alon Albalak commited on Nov 7

Commit

6cef7dd

1 Parent(s): 65bd58a

minor fixes

Files changed (2) hide show

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ from src.session.session_manager import SessionManager
 from src.ui.template_renderer import TemplateRenderer
 from src.ui.page_handlers import PageHandlers
 from src.ui.interface_builder import InterfaceBuilder
-from src.config.settings import DEFAULT_SERVER_NAME, DEFAULT_SERVER_PORT, DEFAULT_SHARE
 class CollaborativeDecodingApp:
     def __init__(self):

 from src.ui.template_renderer import TemplateRenderer
 from src.ui.page_handlers import PageHandlers
 from src.ui.interface_builder import InterfaceBuilder
 class CollaborativeDecodingApp:
     def __init__(self):

src/models/llm_manager.py CHANGED Viewed

@@ -86,6 +86,9 @@ class LLMManager:
                 temperature=1.0,
                 pad_token_id=self.tokenizer.eos_token_id
             )
         full_response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         assistant_part = full_response.split("Assistant: ")[-1]

                 temperature=1.0,
                 pad_token_id=self.tokenizer.eos_token_id
             )
+        # Move output back to CPU and decode
+        outputs = outputs.cpu()
         full_response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         assistant_part = full_response.split("Assistant: ")[-1]