Training in progress, step 52000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +299 -7

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a65415a9d174aeb6628f2a1f3312063a7b378d9e9b6140f0c42d8a550caf91d7
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e01ff6aadb44db27b60f5a2939c1f91ceef8ce4c8eda33e8448193e02f7dedf
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd517c20ac98c90d8ce6f5887bb515507de628ca9fd8fe91aa578d3677906648
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:b312a19a4c3a50bbc6d51dc9137976fee7cefb77fe462694cf14c53d8b7b3ed9
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba01fbde1e06f07c52269f0f4ecd17f79378b8843a5ca873c42d0450dd248933
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:01dad4027d20eca2d7fa4b583f03a1d3875b3ab481ed98527232c092bb93df17
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2506b019d401bb5719d882cc120b44ae3c311583a2faec565dae037f51160d5
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:a000201d58220548b692d7c263c2ef536a136348b8e258b7e7e4280e42ea9770
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0c8e4e92a6a4d6dc0cfaa1d114795a3cfc8bb22eeb20851eec07e893ae0e183
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:c18215b26f935a6486c705cff1ccfa7de15b6db51bcfbab399fb0323c2730116
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 44000,
-  "best_metric": 0.9900904784547742,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-44000",
-  "epoch": 1.536,
   "eval_steps": 4000,
-  "global_step": 48000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3512,6 +3512,298 @@
       "eval_samples_per_second": 128.979,
       "eval_steps_per_second": 8.061,
       "step": 48000
     }
   ],
   "logging_steps": 100,
@@ -3526,7 +3818,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
@@ -3540,7 +3832,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.0383461668418547e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 52000,
+  "best_metric": 0.9908199660129274,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-52000",
+  "epoch": 1.6640000000000001,
   "eval_steps": 4000,
+  "global_step": 52000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 128.979,
       "eval_steps_per_second": 8.061,
       "step": 48000
+    },
+    {
+      "epoch": 1.5392000000000001,
+      "grad_norm": 6.397082805633545,
+      "learning_rate": 1.388776886035313e-05,
+      "loss": 0.035,
+      "step": 48100
+    },
+    {
+      "epoch": 1.5424,
+      "grad_norm": 0.11342862993478775,
+      "learning_rate": 1.3874927768860353e-05,
+      "loss": 0.0541,
+      "step": 48200
+    },
+    {
+      "epoch": 1.5455999999999999,
+      "grad_norm": 0.02208523452281952,
+      "learning_rate": 1.3862086677367576e-05,
+      "loss": 0.0506,
+      "step": 48300
+    },
+    {
+      "epoch": 1.5488,
+      "grad_norm": 0.15493257343769073,
+      "learning_rate": 1.38492455858748e-05,
+      "loss": 0.0283,
+      "step": 48400
+    },
+    {
+      "epoch": 1.552,
+      "grad_norm": 0.004556428641080856,
+      "learning_rate": 1.3836404494382023e-05,
+      "loss": 0.0583,
+      "step": 48500
+    },
+    {
+      "epoch": 1.5552000000000001,
+      "grad_norm": 0.10255400836467743,
+      "learning_rate": 1.3823563402889246e-05,
+      "loss": 0.0379,
+      "step": 48600
+    },
+    {
+      "epoch": 1.5584,
+      "grad_norm": 0.04857850447297096,
+      "learning_rate": 1.3810722311396469e-05,
+      "loss": 0.0362,
+      "step": 48700
+    },
+    {
+      "epoch": 1.5615999999999999,
+      "grad_norm": 0.07100783288478851,
+      "learning_rate": 1.3797881219903692e-05,
+      "loss": 0.0691,
+      "step": 48800
+    },
+    {
+      "epoch": 1.5648,
+      "grad_norm": 10.417929649353027,
+      "learning_rate": 1.3785040128410915e-05,
+      "loss": 0.0555,
+      "step": 48900
+    },
+    {
+      "epoch": 1.568,
+      "grad_norm": 0.06572629511356354,
+      "learning_rate": 1.3772199036918138e-05,
+      "loss": 0.0373,
+      "step": 49000
+    },
+    {
+      "epoch": 1.5712000000000002,
+      "grad_norm": 0.47768735885620117,
+      "learning_rate": 1.3759357945425361e-05,
+      "loss": 0.0483,
+      "step": 49100
+    },
+    {
+      "epoch": 1.5744,
+      "grad_norm": 0.07465988397598267,
+      "learning_rate": 1.3746516853932586e-05,
+      "loss": 0.0327,
+      "step": 49200
+    },
+    {
+      "epoch": 1.5776,
+      "grad_norm": 0.018970176577568054,
+      "learning_rate": 1.373367576243981e-05,
+      "loss": 0.0493,
+      "step": 49300
+    },
+    {
+      "epoch": 1.5808,
+      "grad_norm": 0.0272968802601099,
+      "learning_rate": 1.3720834670947033e-05,
+      "loss": 0.0418,
+      "step": 49400
+    },
+    {
+      "epoch": 1.584,
+      "grad_norm": 0.010071586817502975,
+      "learning_rate": 1.3707993579454256e-05,
+      "loss": 0.0416,
+      "step": 49500
+    },
+    {
+      "epoch": 1.5872000000000002,
+      "grad_norm": 0.13110236823558807,
+      "learning_rate": 1.3695152487961479e-05,
+      "loss": 0.0353,
+      "step": 49600
+    },
+    {
+      "epoch": 1.5904,
+      "grad_norm": 0.9969918727874756,
+      "learning_rate": 1.3682311396468702e-05,
+      "loss": 0.046,
+      "step": 49700
+    },
+    {
+      "epoch": 1.5936,
+      "grad_norm": 0.010477591305971146,
+      "learning_rate": 1.3669470304975925e-05,
+      "loss": 0.0351,
+      "step": 49800
+    },
+    {
+      "epoch": 1.5968,
+      "grad_norm": 14.14805793762207,
+      "learning_rate": 1.3656629213483148e-05,
+      "loss": 0.0376,
+      "step": 49900
+    },
+    {
+      "epoch": 1.6,
+      "grad_norm": 0.004804316442459822,
+      "learning_rate": 1.3643788121990371e-05,
+      "loss": 0.0381,
+      "step": 50000
+    },
+    {
+      "epoch": 1.6032,
+      "grad_norm": 0.9756079912185669,
+      "learning_rate": 1.3630947030497595e-05,
+      "loss": 0.0495,
+      "step": 50100
+    },
+    {
+      "epoch": 1.6064,
+      "grad_norm": 0.005941998213529587,
+      "learning_rate": 1.3618105939004818e-05,
+      "loss": 0.0404,
+      "step": 50200
+    },
+    {
+      "epoch": 1.6096,
+      "grad_norm": 0.017781252041459084,
+      "learning_rate": 1.3605264847512039e-05,
+      "loss": 0.0467,
+      "step": 50300
+    },
+    {
+      "epoch": 1.6128,
+      "grad_norm": 0.11217786371707916,
+      "learning_rate": 1.3592423756019262e-05,
+      "loss": 0.0348,
+      "step": 50400
+    },
+    {
+      "epoch": 1.616,
+      "grad_norm": 1.8749943971633911,
+      "learning_rate": 1.3579582664526485e-05,
+      "loss": 0.0323,
+      "step": 50500
+    },
+    {
+      "epoch": 1.6192,
+      "grad_norm": 0.07430779188871384,
+      "learning_rate": 1.3566741573033709e-05,
+      "loss": 0.0481,
+      "step": 50600
+    },
+    {
+      "epoch": 1.6223999999999998,
+      "grad_norm": 0.22179456055164337,
+      "learning_rate": 1.3553900481540932e-05,
+      "loss": 0.0424,
+      "step": 50700
+    },
+    {
+      "epoch": 1.6256,
+      "grad_norm": 0.020223159343004227,
+      "learning_rate": 1.3541059390048155e-05,
+      "loss": 0.0398,
+      "step": 50800
+    },
+    {
+      "epoch": 1.6288,
+      "grad_norm": 0.021107584238052368,
+      "learning_rate": 1.3528218298555378e-05,
+      "loss": 0.0326,
+      "step": 50900
+    },
+    {
+      "epoch": 1.6320000000000001,
+      "grad_norm": 0.047376956790685654,
+      "learning_rate": 1.3515377207062601e-05,
+      "loss": 0.0544,
+      "step": 51000
+    },
+    {
+      "epoch": 1.6352,
+      "grad_norm": 17.578815460205078,
+      "learning_rate": 1.3502536115569824e-05,
+      "loss": 0.0629,
+      "step": 51100
+    },
+    {
+      "epoch": 1.6383999999999999,
+      "grad_norm": 18.477867126464844,
+      "learning_rate": 1.3489695024077047e-05,
+      "loss": 0.039,
+      "step": 51200
+    },
+    {
+      "epoch": 1.6416,
+      "grad_norm": 1.2129385471343994,
+      "learning_rate": 1.347685393258427e-05,
+      "loss": 0.0442,
+      "step": 51300
+    },
+    {
+      "epoch": 1.6448,
+      "grad_norm": 0.21100889146327972,
+      "learning_rate": 1.3464012841091494e-05,
+      "loss": 0.0588,
+      "step": 51400
+    },
+    {
+      "epoch": 1.6480000000000001,
+      "grad_norm": 0.01275007613003254,
+      "learning_rate": 1.3451171749598717e-05,
+      "loss": 0.0467,
+      "step": 51500
+    },
+    {
+      "epoch": 1.6512,
+      "grad_norm": 8.823915481567383,
+      "learning_rate": 1.343833065810594e-05,
+      "loss": 0.0379,
+      "step": 51600
+    },
+    {
+      "epoch": 1.6543999999999999,
+      "grad_norm": 4.7289252281188965,
+      "learning_rate": 1.3425489566613163e-05,
+      "loss": 0.041,
+      "step": 51700
+    },
+    {
+      "epoch": 1.6576,
+      "grad_norm": 0.026279212906956673,
+      "learning_rate": 1.3412648475120386e-05,
+      "loss": 0.0551,
+      "step": 51800
+    },
+    {
+      "epoch": 1.6608,
+      "grad_norm": 9.168363571166992,
+      "learning_rate": 1.339980738362761e-05,
+      "loss": 0.0357,
+      "step": 51900
+    },
+    {
+      "epoch": 1.6640000000000001,
+      "grad_norm": 0.06355811655521393,
+      "learning_rate": 1.3386966292134832e-05,
+      "loss": 0.0416,
+      "step": 52000
+    },
+    {
+      "epoch": 1.6640000000000001,
+      "eval_accuracy": 0.99082,
+      "eval_f1": 0.9908199660129274,
+      "eval_loss": 0.035849522799253464,
+      "eval_precision": 0.9908199447350458,
+      "eval_recall": 0.99082,
+      "eval_runtime": 774.0001,
+      "eval_samples_per_second": 129.199,
+      "eval_steps_per_second": 8.075,
+      "step": 52000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 2.208251621920823e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null