StockPricePrediction/.github/workflows/model.yml at main · IE7374-MachineLearningOperations/StockPricePrediction · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
name: Train ML Model

on:
  push:
    branches:
      - main
      - citest

jobs:
  setup-and-deploy:
    runs-on: ubuntu-22.04
    steps:
    # Step 1
    - name: Checkout code
      uses: actions/checkout@v2

    # Step 2: Set up Google Cloud SDK
    - name: Set up Cloud SDK
      uses: google-github-actions/setup-gcloud@v0.2.0
      with:
        project_id: ${{ secrets.GCP_PROJECT_ID }}
        service_account_key: ${{ secrets.GCP_SERVICE_ACCOUNT_KEY }}
        export_default_credentials: true

    # Step 3: Verify Python environment
    - name: Set up Python
      uses: actions/setup-python@v2
      with:
        python-version: '3.10'

    # Step 4: Create `trainer` package
    - name: Create Trainer Package
      run: |
        mkdir -p trainer
        echo " " > trainer/__init__.py
        cat << EOF > trainer/task.py
        import tensorflow as tf
        import argparse

        def train_model(data_path, epochs, batch_size):
            dataset = tf.data.experimental.CsvDataset(data_path, [tf.float32, tf.float32])
            dataset = dataset.batch(batch_size)
            model = tf.keras.Sequential([
                tf.keras.layers.Dense(10, activation='relu', input_shape=(1,)),
                tf.keras.layers.Dense(1)
            ])
            model.compile(optimizer='adam', loss='mean_squared_error')
            model.fit(dataset, epochs=epochs)
            model.save('model_output')
            print("Model saved to 'model_output/'")

        if __name__ == "__main__":
            parser = argparse.ArgumentParser()
            parser.add_argument('--data-path', type=str, required=True, help='Path to training data')
            parser.add_argument('--epochs', type=int, default=10, help='Number of training epochs')
            parser.add_argument('--batch-size', type=int, default=32, help='Batch size for training')
            args = parser.parse_args()
            train_model(args.data_path, args.epochs, args.batch_size)
        EOF

        cat << EOF > setup.py
        from setuptools import find_packages, setup
        setup(
            name='trainer',
            version='0.1',
            packages=find_packages(),
            install_requires=['tensorflow>=2.0'],
            entry_points={
                'console_scripts': ['trainer = trainer.task:main'],
            },
        )
        EOF

    # Step 5: Package the Trainer Code
    - name: Package Trainer
      run: |
        python setup.py sdist

    # Step 6: Upload Package to GCS
    - name: Upload Trainer Package to GCS
      run: |
        gsutil cp dist/trainer-0.1.tar.gz gs://${{ secrets.GCS_BUCKET_NAME }}/trainer/trainer-0.1.tar.gz

    # Step 7: Trigger Vertex AI Custom Job
    - name: Trigger Vertex AI Training Job
      run: |
        gcloud config set project ${{ secrets.GCP_PROJECT_ID }}
        gcloud ai custom-jobs create \
          --region=${{ secrets.GOOGLE_CLOUD_REGION }} \
          --display-name=model-training \
          --args="--data-path=gs://${{ secrets.GCS_BUCKET_NAME }}/pipeline/airflow/dags/data/scaled_data_train.csv --epochs=10 --batch-size=32" \
          --python-package-uris=gs://${{ secrets.GCS_BUCKET_NAME }}/trainer/trainer-0.1.tar.gz \
          --worker-pool-spec="machine-type=e2-standard-4,executor-image-uri=us-docker.pkg.dev/vertex-ai/training/tf-cpu.2-9:latest,python-module=trainer.task"

    # Step 8: Notify Completion
    - name: Notify Completion
      run: |
          echo "Model Training on Vertex AI is starting..."
          echo "Preparing to notify about model training completion."