Training in progress, step 48000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +296 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:16dadfb9608dcaa99e56c16537431ef4528e7f7edc4ac58dfea4bb46f7e1c8a9
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:a65415a9d174aeb6628f2a1f3312063a7b378d9e9b6140f0c42d8a550caf91d7
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a2d226450cdcebcf2615a1d39959652fe5438e10e2d6cd2cb8d2468a792f8b2
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd517c20ac98c90d8ce6f5887bb515507de628ca9fd8fe91aa578d3677906648
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97462624a2fc53c8574a0620aac025280c9bdbbb7138ff03f47f37018b457bf4
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba01fbde1e06f07c52269f0f4ecd17f79378b8843a5ca873c42d0450dd248933
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e9a989616374c693d6e283e9a661c77047898be59d9e06a73f69b65c271f395
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2506b019d401bb5719d882cc120b44ae3c311583a2faec565dae037f51160d5
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7880c38c083e20dc3aacb94693eef3b1547dc3e69aff0279d80323326c2ebc49
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0c8e4e92a6a4d6dc0cfaa1d114795a3cfc8bb22eeb20851eec07e893ae0e183
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 44000,
   "best_metric": 0.9900904784547742,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-44000",
-  "epoch": 1.408,
   "eval_steps": 4000,
-  "global_step": 44000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3220,6 +3220,298 @@
       "eval_samples_per_second": 129.014,
       "eval_steps_per_second": 8.063,
       "step": 44000
     }
   ],
   "logging_steps": 100,
@@ -3234,7 +3526,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
@@ -3248,7 +3540,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.8683917813152307e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 44000,
   "best_metric": 0.9900904784547742,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-44000",
+  "epoch": 1.536,
   "eval_steps": 4000,
+  "global_step": 48000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 129.014,
       "eval_steps_per_second": 8.063,
       "step": 44000
+    },
+    {
+      "epoch": 1.4112,
+      "grad_norm": 0.6451414823532104,
+      "learning_rate": 1.4401412520064206e-05,
+      "loss": 0.044,
+      "step": 44100
+    },
+    {
+      "epoch": 1.4144,
+      "grad_norm": 0.03619956597685814,
+      "learning_rate": 1.438857142857143e-05,
+      "loss": 0.0386,
+      "step": 44200
+    },
+    {
+      "epoch": 1.4176,
+      "grad_norm": 0.005635638255625963,
+      "learning_rate": 1.4375730337078653e-05,
+      "loss": 0.0371,
+      "step": 44300
+    },
+    {
+      "epoch": 1.4208,
+      "grad_norm": 20.394947052001953,
+      "learning_rate": 1.4362889245585876e-05,
+      "loss": 0.0468,
+      "step": 44400
+    },
+    {
+      "epoch": 1.424,
+      "grad_norm": 0.008449492044746876,
+      "learning_rate": 1.4350048154093099e-05,
+      "loss": 0.0536,
+      "step": 44500
+    },
+    {
+      "epoch": 1.4272,
+      "grad_norm": 0.06385083496570587,
+      "learning_rate": 1.4337207062600322e-05,
+      "loss": 0.0383,
+      "step": 44600
+    },
+    {
+      "epoch": 1.4304000000000001,
+      "grad_norm": 0.016077406704425812,
+      "learning_rate": 1.4324365971107545e-05,
+      "loss": 0.0341,
+      "step": 44700
+    },
+    {
+      "epoch": 1.4336,
+      "grad_norm": 0.012415707111358643,
+      "learning_rate": 1.4311524879614768e-05,
+      "loss": 0.0356,
+      "step": 44800
+    },
+    {
+      "epoch": 1.4368,
+      "grad_norm": 0.03126490116119385,
+      "learning_rate": 1.4298683788121991e-05,
+      "loss": 0.0456,
+      "step": 44900
+    },
+    {
+      "epoch": 1.44,
+      "grad_norm": 5.324023723602295,
+      "learning_rate": 1.4285842696629215e-05,
+      "loss": 0.0653,
+      "step": 45000
+    },
+    {
+      "epoch": 1.4432,
+      "grad_norm": 0.02962222322821617,
+      "learning_rate": 1.4273001605136438e-05,
+      "loss": 0.0664,
+      "step": 45100
+    },
+    {
+      "epoch": 1.4464000000000001,
+      "grad_norm": 0.03100472316145897,
+      "learning_rate": 1.426016051364366e-05,
+      "loss": 0.0494,
+      "step": 45200
+    },
+    {
+      "epoch": 1.4496,
+      "grad_norm": 8.572321891784668,
+      "learning_rate": 1.4247319422150884e-05,
+      "loss": 0.0276,
+      "step": 45300
+    },
+    {
+      "epoch": 1.4527999999999999,
+      "grad_norm": 0.004455466754734516,
+      "learning_rate": 1.4234478330658109e-05,
+      "loss": 0.0292,
+      "step": 45400
+    },
+    {
+      "epoch": 1.456,
+      "grad_norm": 0.03781688213348389,
+      "learning_rate": 1.4221637239165332e-05,
+      "loss": 0.0407,
+      "step": 45500
+    },
+    {
+      "epoch": 1.4592,
+      "grad_norm": 10.108696937561035,
+      "learning_rate": 1.4208796147672552e-05,
+      "loss": 0.0531,
+      "step": 45600
+    },
+    {
+      "epoch": 1.4624,
+      "grad_norm": 0.059839170426130295,
+      "learning_rate": 1.4195955056179775e-05,
+      "loss": 0.0373,
+      "step": 45700
+    },
+    {
+      "epoch": 1.4656,
+      "grad_norm": 0.00919304322451353,
+      "learning_rate": 1.4183113964686998e-05,
+      "loss": 0.0402,
+      "step": 45800
+    },
+    {
+      "epoch": 1.4687999999999999,
+      "grad_norm": 12.830222129821777,
+      "learning_rate": 1.4170272873194221e-05,
+      "loss": 0.0321,
+      "step": 45900
+    },
+    {
+      "epoch": 1.472,
+      "grad_norm": 0.006019544322043657,
+      "learning_rate": 1.4157431781701444e-05,
+      "loss": 0.0327,
+      "step": 46000
+    },
+    {
+      "epoch": 1.4752,
+      "grad_norm": 0.024647433310747147,
+      "learning_rate": 1.4144590690208669e-05,
+      "loss": 0.0386,
+      "step": 46100
+    },
+    {
+      "epoch": 1.4784,
+      "grad_norm": 0.01691538281738758,
+      "learning_rate": 1.4131749598715892e-05,
+      "loss": 0.0523,
+      "step": 46200
+    },
+    {
+      "epoch": 1.4816,
+      "grad_norm": 0.007636231370270252,
+      "learning_rate": 1.4118908507223115e-05,
+      "loss": 0.043,
+      "step": 46300
+    },
+    {
+      "epoch": 1.4848,
+      "grad_norm": 0.04239976033568382,
+      "learning_rate": 1.4106067415730338e-05,
+      "loss": 0.0422,
+      "step": 46400
+    },
+    {
+      "epoch": 1.488,
+      "grad_norm": 6.693536758422852,
+      "learning_rate": 1.4093226324237562e-05,
+      "loss": 0.0412,
+      "step": 46500
+    },
+    {
+      "epoch": 1.4912,
+      "grad_norm": 0.014838839881122112,
+      "learning_rate": 1.4080385232744785e-05,
+      "loss": 0.038,
+      "step": 46600
+    },
+    {
+      "epoch": 1.4944,
+      "grad_norm": 9.719799995422363,
+      "learning_rate": 1.4067544141252008e-05,
+      "loss": 0.056,
+      "step": 46700
+    },
+    {
+      "epoch": 1.4976,
+      "grad_norm": 4.120741367340088,
+      "learning_rate": 1.4054703049759231e-05,
+      "loss": 0.0453,
+      "step": 46800
+    },
+    {
+      "epoch": 1.5008,
+      "grad_norm": 0.019338663667440414,
+      "learning_rate": 1.4041861958266454e-05,
+      "loss": 0.0355,
+      "step": 46900
+    },
+    {
+      "epoch": 1.504,
+      "grad_norm": 0.015643298625946045,
+      "learning_rate": 1.4029020866773677e-05,
+      "loss": 0.0276,
+      "step": 47000
+    },
+    {
+      "epoch": 1.5072,
+      "grad_norm": 11.701508522033691,
+      "learning_rate": 1.40161797752809e-05,
+      "loss": 0.0513,
+      "step": 47100
+    },
+    {
+      "epoch": 1.5104,
+      "grad_norm": 0.00980925839394331,
+      "learning_rate": 1.4003338683788124e-05,
+      "loss": 0.0304,
+      "step": 47200
+    },
+    {
+      "epoch": 1.5135999999999998,
+      "grad_norm": 0.018979301676154137,
+      "learning_rate": 1.3990497592295347e-05,
+      "loss": 0.0443,
+      "step": 47300
+    },
+    {
+      "epoch": 1.5168,
+      "grad_norm": 9.20014762878418,
+      "learning_rate": 1.397765650080257e-05,
+      "loss": 0.0411,
+      "step": 47400
+    },
+    {
+      "epoch": 1.52,
+      "grad_norm": 0.06917817145586014,
+      "learning_rate": 1.3964815409309793e-05,
+      "loss": 0.0414,
+      "step": 47500
+    },
+    {
+      "epoch": 1.5232,
+      "grad_norm": 22.683095932006836,
+      "learning_rate": 1.3951974317817016e-05,
+      "loss": 0.0338,
+      "step": 47600
+    },
+    {
+      "epoch": 1.5264,
+      "grad_norm": 0.03558173030614853,
+      "learning_rate": 1.393913322632424e-05,
+      "loss": 0.0396,
+      "step": 47700
+    },
+    {
+      "epoch": 1.5295999999999998,
+      "grad_norm": 0.12180989980697632,
+      "learning_rate": 1.3926292134831462e-05,
+      "loss": 0.0359,
+      "step": 47800
+    },
+    {
+      "epoch": 1.5328,
+      "grad_norm": 2.8462178707122803,
+      "learning_rate": 1.3913451043338686e-05,
+      "loss": 0.0234,
+      "step": 47900
+    },
+    {
+      "epoch": 1.536,
+      "grad_norm": 0.032463911920785904,
+      "learning_rate": 1.3900609951845907e-05,
+      "loss": 0.0389,
+      "step": 48000
+    },
+    {
+      "epoch": 1.536,
+      "eval_accuracy": 0.98882,
+      "eval_f1": 0.9888222770915966,
+      "eval_loss": 0.051280781626701355,
+      "eval_precision": 0.9888728773724597,
+      "eval_recall": 0.98882,
+      "eval_runtime": 775.3173,
+      "eval_samples_per_second": 128.979,
+      "eval_steps_per_second": 8.061,
+      "step": 48000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 2.0383461668418547e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null