Merge pull request #22 from LyaaaaaGames/Fix_Translator_Not_Loading

Lyaaaaaaaaaaaaaaa · web-flow · commit 980effc11fd4 · 2023-09-19T10:40:41.000+02:00
Fixed an error with the translator and some typos
diff --git a/server/model.py b/server/model.py
@@ -165,6 +165,15 @@
 #--    - Extracted from init to load the code related to the loading of files.
 #--    - Splitted download into download_model and download_tokens.
 #--    - Splitted save into save_model and save_tokens.
+#--
+#--  - 19/09/2023 Lyaaaaa
+#--    - Updated _set_model_parameters to set all the parameters only for the
+#--        generators (except low_memory_mode which is used by the translator too).
+#--    - Removed some log from _load as they are repeating themself.
+#--    - Updated _download_tokens to directly use self._model_name.
+#--    - Fixed an error in _download_model. It used model_name which doesn't
+#--        exist. Now it uses self._model_name.
+#--    - Updated the logs in  _load_model and _load_tokens.
 #------------------------------------------------------------------------------
 
 from transformers import AutoModelForCausalLM, AutoModelForSeq2SeqLM, AutoTokenizer
@@ -230,29 +239,30 @@ def _set_model_parameters(self, p_parameters : dict):
     if self._low_memory_mode == None:
       self._low_memory_mode  = p_parameters["low_memory_mode"]
 
-    if self._limit_memory == False:
-      self._max_memory = None
-    elif self._limit_memory == None and p_parameters["limit_memory"] == True:
-      self._max_memory = {0     : p_parameters["max_memory"]["0"],
-                          "cpu" : p_parameters["max_memory"]["cpu"]}
+    if self._model_type == Model_Type.GENERATION.value:
+      if self._limit_memory == False:
+        self._max_memory = None
+      elif self._limit_memory == None and p_parameters["limit_memory"] == True:
+        self._max_memory = {0     : p_parameters["max_memory"]["0"],
+                            "cpu" : p_parameters["max_memory"]["cpu"]}
 
-    if self._allow_offload == True:
-      self.create_offload_folder()
-    elif self._allow_offload == None and p_parameters["allow_offload"] == True:
-      self.create_offload_folder()
+      if self._allow_offload == True:
+        self.create_offload_folder()
+      elif self._allow_offload == None and p_parameters["allow_offload"] == True:
+        self.create_offload_folder()
 
 
-    if self._allow_download == None:
-      self._allow_download = p_parameters["allow_download"]
+      if self._allow_download == None:
+        self._allow_download = p_parameters["allow_download"]
 
-    if self._device_map == None:
-      self._device_map = p_parameters["device_map"]
+      if self._device_map == None:
+        self._device_map = p_parameters["device_map"]
 
-    if self._torch_dtype == None:
-      self._torch_dtype = Torch_Dtypes.dtypes.value[p_parameters["torch_dtype"]]
+      if self._torch_dtype == None:
+        self._torch_dtype = Torch_Dtypes.dtypes.value[p_parameters["torch_dtype"]]
 
-    if self._offload_dict == None:
-      self._offload_dict = p_parameters["offload_dict"]
+      if self._offload_dict == None:
+        self._offload_dict = p_parameters["offload_dict"]
 
 #------------------------------------------------------------------------------
 #--
@@ -264,7 +274,6 @@ def _load(self):
       if self._allow_download == True:
         self._download_tokens()
       else:
-        logger.log.error("Couldn't load the tokens files.")
         logger.log.info("Downloading with the server is disabled")
     else:
       logger.log.info("Tokens successfully loaded from local files")
@@ -280,7 +289,6 @@ def _load(self):
       if self._allow_download == True:
         self._download_model()
       else:
-        logger.log.error("Couldn't load the model " + self._model_name)
         logger.log.info("Downloading with the server is disabled.")
     else:
       logger.log.info("Model successfully loaded from local files")
@@ -295,7 +303,7 @@ def _load_tokens(self):
     try:
       self._Tokenizer = AutoTokenizer.from_pretrained(self._tokenizers_path)
     except Exception as e:
-      logger.log.error("Token file in '" + self._tokenizers_path + "' not found.")
+      logger.log.error("Error loading tokens in " + self._tokenizers_path)
       logger.log.error(e)
       return False
 
@@ -320,7 +328,7 @@ def _load_model(self):
       self._Model = AutoModelForCausalLM.from_pretrained(self._model_path,
                                                          **args)
     except Exception as e:
-      logger.log.error("An unexpected error happened while loading the model")
+      logger.log.error("Error loading the model " + self._model_name)
       logger.log.error(e)
       return False
 
@@ -360,9 +368,8 @@ def _save_model(self):
 #--
 #------------------------------------------------------------------------------
   def _download_tokens(self):
-    model_name = self._model_name
     logger.log.info("Trying to download the tokenizer...")
-    self._Tokenizer = AutoTokenizer.from_pretrained(model_name,
+    self._Tokenizer = AutoTokenizer.from_pretrained(self._model_name,
                                                     cache_dir       = "cache",
                                                     resume_download = True)
     self._save_tokens()
@@ -374,11 +381,11 @@ def _download_tokens(self):
   def _download_model(self):
     logger.log.info("Trying to download the model...")
     if self._model_type == Model_Type.GENERATION.value:
-      self._Model = AutoModelForCausalLM.from_pretrained(model_name,
+      self._Model = AutoModelForCausalLM.from_pretrained(self._model_name,
                                                          cache_dir       = "cache",
                                                          resume_download = True)
     elif self._model_type == Model_Type.TRANSLATION.value:
-      self._Model = AutoModelForSeq2SeqLM.from_pretrained(model_name,
+      self._Model = AutoModelForSeq2SeqLM.from_pretrained(self._model_name,
                                                           cache_dir       = "cache",
                                                           resume_download = True)
     self._save_model()
diff --git a/server/server.py b/server/server.py
@@ -96,6 +96,11 @@
 #--    - Replaced the print here and there by logger.log.info
 #--    - Updated the exceptions handlers in handler to display the error.
 #--    - Updated shutdown_server to receive an exit code and to display a message.
+#--
+#--  - 19/09/2023 Lyaaaaa
+#--    - Fixed a syntax error in handler.
+#--    - Updated handle_request to define parameters differently depending of
+#--        the model type (generator or translator).
 #------------------------------------------------------------------------------
 
 import asyncio
@@ -135,7 +140,7 @@ async def handler(p_websocket, path):
         await p_websocket.send(data_to_send)
 
   except websockets.exceptions.ConnectionClosed as e:
-    logger.info(e)
+    logger.info.error(e)
     exit_code = 0
     shutdown_server(exit_code)
 
@@ -175,16 +180,15 @@ def handle_request(p_websocket, p_data : dict):
     shutdown_server()
 
   elif request == Request.LOAD_MODEL.value:
-    parameters = {"low_memory_mode" : p_data['low_memory_mode'],
-                  "allow_offload"   : p_data['allow_offload'],
-                  "limit_memory"    : p_data['limit_memory'],
-                  "max_memory"      : p_data['max_memory'],
-                  "allow_download"  : p_data['allow_download'],
-                  "device_map"      : p_data['device_map'],
-                  "torch_dtype"     : p_data['torch_dtype'],
-                  "offload_dict"    : p_data['offload_dict'],}
-
     if p_data["model_type"] == Model_Type.GENERATION.value:
+      parameters = {"low_memory_mode" : p_data['low_memory_mode'],
+                    "allow_offload"   : p_data['allow_offload'],
+                    "limit_memory"    : p_data['limit_memory'],
+                    "max_memory"      : p_data['max_memory'],
+                    "allow_download"  : p_data['allow_download'],
+                    "device_map"      : p_data['device_map'],
+                    "torch_dtype"     : p_data['torch_dtype'],
+                    "offload_dict"    : p_data['offload_dict'],}
       del generator
       logger.log.debug("loading generator")
       model_name = p_data['model_name']
@@ -195,6 +199,7 @@ def handle_request(p_websocket, p_data : dict):
       logger.log.info("Is CUDA available: " + format(generator.is_cuda_available))
 
     elif p_data["model_type"] == Model_Type.TRANSLATION.value:
+      parameters = {"low_memory_mode" : p_data['low_memory_mode']}
       logger.log.debug("loading translator")
       model_name = p_data["to_eng_model"]
       to_eng_translator = Translator(model_name,