Spaces:

attilasimko
/

reproduce

Sleeping

App Files Files Community

attilasimko commited on Oct 2, 2024

Commit

6e3c928

1 Parent(s): f6e3be7

Push new changes

Browse files

Files changed (5) hide show

evaluations/repo_evaluations.py +12 -22
evaluations/utils.py +8 -2
evaluations/validating.py +2 -4
full_eval.py +11 -0
midl.py +3 -2

evaluations/repo_evaluations.py CHANGED Viewed

@@ -10,15 +10,11 @@ from huggingface_hub import InferenceClient
 API_URL = "https://api-inference.huggingface.co/models/openlm-research/open_llama_3b_v2"
 headers = {"Authorization": "Bearer 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", "x-wait-for-model": "true"}
 client = InferenceClient(
     "meta-llama/Llama-3.1-8B-Instruct",
     token="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",
 )
-def init_llm(verbose):
-  log(verbose, "LOG", "Initializing LLM...")
 def evaluate(llm, verbose, repo_url, title=None, year=None):
   repository_zip_name = "data/repo.zip"
   token = os.getenv("githubToken")
@@ -35,11 +31,6 @@ def evaluate(llm, verbose, repo_url, title=None, year=None):
       if (get_api_link(repo_url) != ""):
           results["pred_valid"] = True
       else:
-          results["pred_live"] = "No"
-          results["pred_training"] = "No"
-          results["pred_evaluation"] = "No"
-          results["pred_weights"] = "No"
-          results["pred_packages"] = "No"
           return results
       username, repo_name = decompose_url(repo_url)
@@ -86,17 +77,13 @@ def evaluate(llm, verbose, repo_url, title=None, year=None):
       results["pred_live"] = "No"
       return results
-def full_evaluations():
   paper_dump = pd.read_csv("data/dump.csv", sep="\t")
-  repro = evaluate(None, False)
   full_results = []
-  nth = 1
   for idx, row in paper_dump.iterrows():
-      if (idx % nth != 0):
-          continue
-      if (row["url"] == ""):
           continue
       print(str(int(100 * idx / paper_dump["title"].count())) + "% done")
@@ -105,6 +92,7 @@ def full_evaluations():
           row[column] = result[column]
       full_results.append(row)
 def midl_evaluations():
   compare_to_gt = True
@@ -138,21 +126,23 @@ def midl_evaluations():
       full_results.append(row)
       if (compare_to_gt):
           print("\nSummary:")
-          if ((row["pred_dependencies"] is not None) & (row["dependencies"] != "")):
               eval_dependencies.append(row["pred_dependencies"] == row["dependencies"])
               print(f"Dependencies acc. - {row['pred_dependencies']} (GT:{row['dependencies']}) / {int(100 * np.mean(eval_dependencies))}%")
-          if ((row["pred_training"] is not None) & (row["training"] != "")):
               eval_training.append(row["training"] == row["pred_training"])
               print(f"Training acc. -{row['pred_training']} (GT:{row['training']}) / {int(100 * np.mean(eval_training))}%")
-          if ((row["pred_evaluation"] is not None) & (row["evaluation"] != "")):
               eval_evaluating.append(row["evaluation"] == row["pred_evaluation"])
               print(f"Evaluating acc. - {row['pred_evaluation']} (GT:{row['evaluation']}) / {int(100 * np.mean(eval_evaluating))}%")
-          if ((row["pred_weights"] is not None) & (row["weights"] != "")):
               eval_weights.append(row["weights"] == row["pred_weights"])
               print(f"Weights acc. - {row['pred_weights']} (GT:{row['weights']}) / {int(100 * np.mean(eval_weights))}%")
-          if ((row["pred_readme"] is not None) & (row["readme"] != "")):
               eval_readme.append(row["readme"] == row["pred_readme"])
               print(f"README acc. - {row['pred_readme']} (GT:{row['readme']}) / {int(100 * np.mean(eval_readme))}%")
-          if ((row["pred_license"] is not None) & (row["license"] != "")):
               eval_licensing.append(("No" if row["license"] == "No" else "Yes") == row["pred_license"])
-              print(f"LICENSE acc. - {row['pred_license']} (GT:{row['license']}) / {int(100 * np.mean(eval_licensing))}%")

 API_URL = "https://api-inference.huggingface.co/models/openlm-research/open_llama_3b_v2"
 headers = {"Authorization": "Bearer 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", "x-wait-for-model": "true"}
 client = InferenceClient(
     "meta-llama/Llama-3.1-8B-Instruct",
     token="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",
 )
 def evaluate(llm, verbose, repo_url, title=None, year=None):
   repository_zip_name = "data/repo.zip"
   token = os.getenv("githubToken")
       if (get_api_link(repo_url) != ""):
           results["pred_valid"] = True
       else:
           return results
       username, repo_name = decompose_url(repo_url)
       results["pred_live"] = "No"
       return results
+def full_evaluation():
   paper_dump = pd.read_csv("data/dump.csv", sep="\t")
   full_results = []
   for idx, row in paper_dump.iterrows():
+      if (pd.isna(row["url"]) | (row["url"] == "")):
           continue
       print(str(int(100 * idx / paper_dump["title"].count())) + "% done")
           row[column] = result[column]
       full_results.append(row)
+  return pd.dataFrame(full_results)
 def midl_evaluations():
   compare_to_gt = True
       full_results.append(row)
       if (compare_to_gt):
           print("\nSummary:")
+          if ((~pd.isna(row["dependencies"])) & (row["pred_dependencies"] is not None)):
               eval_dependencies.append(row["pred_dependencies"] == row["dependencies"])
               print(f"Dependencies acc. - {row['pred_dependencies']} (GT:{row['dependencies']}) / {int(100 * np.mean(eval_dependencies))}%")
+          if ((~pd.isna(row["training"])) & (row["pred_dependencies"] is not None)):
               eval_training.append(row["training"] == row["pred_training"])
               print(f"Training acc. -{row['pred_training']} (GT:{row['training']}) / {int(100 * np.mean(eval_training))}%")
+          if ((~pd.isna(row["evaluation"])) & (row["pred_dependencies"] is not None)):
               eval_evaluating.append(row["evaluation"] == row["pred_evaluation"])
               print(f"Evaluating acc. - {row['pred_evaluation']} (GT:{row['evaluation']}) / {int(100 * np.mean(eval_evaluating))}%")
+          if ((~pd.isna(row["weights"])) & (row["pred_dependencies"] is not None)):
               eval_weights.append(row["weights"] == row["pred_weights"])
               print(f"Weights acc. - {row['pred_weights']} (GT:{row['weights']}) / {int(100 * np.mean(eval_weights))}%")
+          if ((~pd.isna(row["readme"])) & (row["pred_dependencies"] is not None)):
               eval_readme.append(row["readme"] == row["pred_readme"])
               print(f"README acc. - {row['pred_readme']} (GT:{row['readme']}) / {int(100 * np.mean(eval_readme))}%")
+          if ((~pd.isna(row["license"])) & (row["pred_dependencies"] is not None)):
               eval_licensing.append(("No" if row["license"] == "No" else "Yes") == row["pred_license"])
+              print(f"LICENSE acc. - {row['pred_license']} (GT:{row['license']}) / {int(100 * np.mean(eval_licensing))}%")
+  return pd.dataFrame(full_results)

evaluations/utils.py CHANGED Viewed

@@ -108,7 +108,10 @@ def log(verbose, log_type, log_text, hf=False):
     # Align line-break
     if (log_text.startswith("\n")):
-        print("\n")
         log_text = log_text.lstrip('\n')
     if (log_type == "LOG"):
@@ -127,4 +130,7 @@ def log(verbose, log_type, log_text, hf=False):
         st.write(log_text)
         return
-    raise Exception(log_text)

     # Align line-break
     if (log_text.startswith("\n")):
+        if (verbose == 1):
+            print("\n")
+        if (verbose == 2):
+            st.write("\n")
         log_text = log_text.lstrip('\n')
     if (log_type == "LOG"):
         st.write(log_text)
         return
+    raise Exception(log_text)
+def init_llm(verbose):
+  log(verbose, "LOG", "Initializing LLM...")

evaluations/validating.py CHANGED Viewed

@@ -8,14 +8,12 @@ def evaluate(verbose, llm, zip, readme):
       'tensorflow': [
           r'tf\.keras\.models\.load_model',  # TensorFlow model loading
           r'tf\.saved_model\.load',
-          r'model\.predict',  # Running inference
-          r'model\(.+\)'  # Direct model invocation for inference
       ],
       'pytorch': [
           r'torch\.load',  # PyTorch model loading
           r'torch\.jit\.load',  # PyTorch JIT model loading
-          r'model\.eval',  # Running inference
-          r'model\(.+\)'  # Direct model invocation for inference
       ]
   }

       'tensorflow': [
           r'tf\.keras\.models\.load_model',  # TensorFlow model loading
           r'tf\.saved_model\.load',
+          r'\.predict',  # Running inference
       ],
       'pytorch': [
           r'torch\.load',  # PyTorch model loading
           r'torch\.jit\.load',  # PyTorch JIT model loading
+          r'\.eval',  # Running inference
       ]
   }

full_eval.py ADDED Viewed

	@@ -0,0 +1,11 @@

+from evaluations.repo_evaluations import full_evaluation
+# importing os module for environment variables
+import os
+# importing necessary functions from dotenv library
+from dotenv import load_dotenv
+# loading variables from .env file
+load_dotenv()
+token = os.getenv("githubToken")
+res = full_evaluation()
+res.to_csv("results.csv", sep="\t", index=False)

midl.py CHANGED Viewed

@@ -2,9 +2,10 @@ from evaluations.repo_evaluations import midl_evaluations
 # importing os module for environment variables
 import os
 # importing necessary functions from dotenv library
-from dotenv import load_dotenv, dotenv_values
 # loading variables from .env file
 load_dotenv()
 token = os.getenv("githubToken")
-midl_evaluations()

 # importing os module for environment variables
 import os
 # importing necessary functions from dotenv library
+from dotenv import load_dotenv
 # loading variables from .env file
 load_dotenv()
 token = os.getenv("githubToken")
+res = midl_evaluations()
+res.to_csv("results_midl.csv", sep="\t", index=False)