Upload PPO drone policy + logs

Files changed (10) hide show

README.md ADDED Viewed

+---
+tags:
+- ppo
+- reinforcement-learning
+- swarm
+- drone
+- bittensor
+license: mit
+language:
+- en
+library_name: stable-baselines3
+---
+# 🚀 Swarm PPO Drone
+This repository contains a **Proximal Policy Optimization (PPO)** model trained for **swarm/drone control**.
+The model was trained using **Gymnasium environments** with Stable-Baselines3 and exported for use in **Bittensor Subnet 124 (Swarm)**.
+---
+## 📂 Files
+- `policy.pth` – Trained PPO policy weights (PyTorch).
+- `ppo_policy.zip` – Stable-Baselines3 PPO saved model (reload with `PPO.load()`).
+- `safe_policy_meta.json` – Metadata for policy compliance.
+- `best/` – Best checkpointed model during training.
+- `eval_logs/` – Evaluation logs.
+- `tb_logs/` – TensorBoard logs.
+---
+## 🛠️ Usage
+### Load with Stable-Baselines3
+```python
+from stable_baselines3 import PPO
+import gymnasium as gym
+# Load model
+model = PPO.load("ppo_policy.zip")
+# Example run
+env = gym.make("CartPole-v1")
+obs, _ = env.reset()
+action, _ = model.predict(obs)
+print("Predicted action:", action)

best/best_model.zip ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd4d36fbc90382f9c3c7600bacf2d1c59a4bde48eeaa8c02f465a54016a5a402
+size 453110

eval_logs/evaluations.npz ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c543d076208115a61a60d2545fb34d60fa4d7a4b5fb6850fd5fda15f7af0982
+size 1210

policy.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:00e25942efd5a414191650af665a6a0abd9d9380a0262c7b679373fd893a2727
+size 41325

ppo_policy.zip ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9baf2c2bf777d356aaa2302a47a3354e595e1a831485901d5dc2da6d6f3393bb
+size 36137

safe_policy_meta.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"activation_fn":"relu","net_arch":{"pi":[64,64],"vf":[64,64]},"use_sde":false}

tb_logs/PPO_1/events.out.tfevents.1756478967.tantrum.1444109.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c4dc0238a2156b584741687919dd50d86e3af016b6f2dc85a1e04b893b6fedf
+size 251

tb_logs/PPO_2/events.out.tfevents.1756479142.tantrum.1445250.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4a73832683ced8e630acf21120f55a9438eff4a2cebe754e5bdfb7048f7681e
+size 11620

tb_logs/PPO_3/events.out.tfevents.1756479433.tantrum.1447230.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:398c9b0ae6a88ecab8a3b52c9fef8ffaba3ebcd27b0b82e470b6d51f234e3c9e
+size 6682

tb_logs/PPO_4/events.out.tfevents.1756480670.tantrum.1454850.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6804c9d13b2a4137ab43c026568f7e991f9b0482e005aa1050a51bbc113f1871
+size 20118