Platform yang didukung Pertimbangan Sumber daya terkait

Blok Kapasitas untuk ML

Blok Kapasitas untuk ML memungkinkan Anda untuk memesan instans GPU yang sangat dicari di masa mendatang untuk mendukung beban kerja machine learning (ML) berdurasi pendek. Instans yang berjalan di dalam Blok Kapasitas secara otomatis ditempatkan berdekatan di dalam Amazon EC2 UltraClusters, untuk jaringan latensi rendah, skala petabit, dan non-pemblokiran.

Dengan Blok Kapasitas, Anda dapat melihat kapan kapasitas instans GPU tersedia di masa mendatang, dan Anda dapat menjadwalkan Blok Kapasitas untuk memulai pada waktu yang paling sesuai untuk Anda. Saat Anda memesan Blok Kapasitas, Anda mendapatkan jaminan kapasitas yang dapat diprediksi untuk instans GPU dengan membayar jumlah waktu yang Anda butuhkan saja. Kami merekomendasikan Blok Kapasitas saat Anda GPUs perlu mendukung beban kerja ML Anda selama berhari-hari atau berminggu-minggu dan tidak ingin membayar reservasi saat instans GPU Anda tidak digunakan.

Berikut ini adalah beberapa kasus penggunaan umum untuk Blok Kapasitas.

Pelatihan model ML dan fine-tuning — Dapatkan akses tanpa gangguan ke instans GPU yang Anda pesan untuk menyelesaikan pelatihan model dan fine-tuning.
Eksperimen dan prototipe ML — Jalankan eksperimen dan bangun prototipe yang memerlukan instans GPU untuk jangka waktu pendek.

Anda dapat memesan Blok Kapasitas dengan waktu mulai reservasi hingga delapan minggu ke depan. Setiap Blok Kapasitas dapat memiliki hingga 64 instans, dan Anda dapat memiliki hingga 256 instans di seluruh Blok Kapasitas.

Anda dapat menggunakan Blok Kapasitas untuk memesanp6-b200,p5,p5e,p5en,p4d,p4de,trn1, dan trn2 instance. Anda dapat menentukan durasi reservasi hingga 182 hari.

Untuk memesan Blok Kapasitas, Anda mulai dengan menentukan kebutuhan kapasitas Anda, termasuk jenis instans, jumlah instans, jumlah waktu, tanggal mulai paling awal, dan tanggal akhir terbaru yang Anda butuhkan. Kemudian, Anda dapat melihat penawaran Blok Kapasitas yang tersedia yang memenuhi spesifikasi Anda. Penawaran Blok Kapasitas mencakup detail seperti waktu mulai, Zona Ketersediaan, dan harga reservasi. Harga penawaran Blok Kapasitas tergantung pada penawaran dan permintaan yang tersedia pada saat penawaran dikirimkan. Setelah Anda memesan Blok Kapasitas, harga tidak berubah. Untuk informasi selengkapnya, lihat Harga dan penagihan Blok Kapasitas.

Saat Anda membeli penawaran Blok Kapasitas, reservasi dibuat sesuai tanggal dan jumlah instans yang Anda pilih. Saat reservasi Blok Kapasitas dimulai, Anda dapat menargetkan peluncuran instans dengan menentukan ID reservasi dalam permintaan peluncuran.

Anda dapat menggunakan semua instans yang Anda pesan hingga 30 menit sebelum waktu Blok Kapasitas berakhir. Dengan 30 menit tersisa di reservasi Blok Kapasitas Anda, kami mulai menghentikan semua instans yang berjalan di Blok Kapasitas. Kami menggunakan waktu ini untuk membersihkan instans Anda sebelum mengirimkan Blok Kapasitas ke pelanggan berikutnya. Kami memancarkan acara melalui EventBridge 10 menit sebelum proses penghentian dimulai. Untuk informasi selengkapnya, lihat Monitor Blok Kapasitas menggunakan EventBridge.

Topik

Platform yang didukung

Blok Kapasitas untuk ML saat ini mendukung p6-b200.48xlargep5.48xlarge,p5e.48xlarge,p5en.48xlarge,p4d.24xlarge,p4de.24xlarge,,trn1.32xlarge, dan trn2.48xlarge instance dengan penyewaan default. Saat Anda menggunakan AWS Management Console untuk membeli Blok Kapasitas, opsi platform default adalah Linux/UNIX. Saat Anda menggunakan AWS Command Line Interface (AWS CLI) atau AWS SDK untuk membeli Blok Kapasitas, opsi platform berikut tersedia:

Linux/UNIX
Linux Red Hat Enterprise
RHEL dengan HA
SUSE Linux
Ubuntu Pro

Pertimbangan

Sebelum Anda menggunakan Blok Kapasitas, pertimbangkan detail dan batasan berikut.

Setiap Blok Kapasitas dapat memiliki hingga 64 instans, dan Anda dapat memiliki hingga 256 instans di seluruh Blok Kapasitas.
Anda dapat menjelaskan penawaran Blok Kapasitas yang dapat dimulai segera setelah 30 menit.
Blok Kapasitas berakhir pada 11:30 Waktu Universal Terkoordinasi (UTC).
Proses pengakhiran untuk instans yang berjalan di Blok Kapasitas dimulai pada pukul 11:00 Waktu Universal Terkoordinasi (UTC) pada hari terakhir reservasi.
Blok Kapasitas dapat dipesan dengan waktu mulai hingga 8 minggu di masa mendatang.
Pembatalan Blok Kapasitas tidak diizinkan.
Blok Kapasitas tidak dapat dipindahkan atau dipecah.
Blok Kapasitas tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.
Blok Kapasitas tidak dapat digunakan dalam grup reservasi kapasitas.
Jumlah total instans yang dapat dicadangkan di Blok Kapasitas di semua akun di AWS Organisasi Anda tidak dapat melebihi 64 instans pada tanggal tertentu.
Untuk menggunakan Blok Kapasitas, instans harus secara khusus menargetkan ID reservasi.
Instans dalam Blok Kapasitas tidak diperhitungkan dalam batas Instans Sesuai Permintaan Anda.
Untuk instans P5 yang menggunakan AMI kustom, pastikan Anda memiliki perangkat lunak dan konfigurasi yang diperlukan untuk EFA.
Untuk grup node terkelola Amazon EKS, lihat Membuat grup simpul terkelola dengan Blok EC2 Kapasitas Amazon untuk ML. Untuk grup node yang dikelola sendiri Amazon EKS, lihat Menggunakan Blok Kapasitas untuk MLdengan node yang dikelola sendiri.

Setelah Anda membuat Blok Kapasitas, Anda dapat melakukan hal berikut dengan Blok Kapasitas:

Luncurkan instance ke dalam Blok Kapasitas. Untuk informasi selengkapnya, lihat Luncurkan instance menggunakan Blok Kapasitas.
Buat grup EC2 Auto Scaling Amazon. Untuk informasi selengkapnya, lihat Menggunakan Blok Kapasitas untuk beban kerja pembelajaran mesin di Panduan Pengguna Amazon EC2 Auto Scaling.

catatan
Jika Anda menggunakan Amazon EC2 Auto Scaling atau Amazon EKS, Anda dapat menjadwalkan penskalaan untuk dijalankan di awal reservasi Blok Kapasitas. Dengan penskalaan terjadwal, AWS secara otomatis menangani percobaan ulang untuk Anda, jadi Anda tidak perlu khawatir menerapkan logika coba lagi untuk menangani kegagalan sementara.
Tingkatkan alur kerja ML dengan AWS ParallelCluster. Untuk informasi selengkapnya, lihat Meningkatkan alur kerja ML dengan dan Blok EC2 Kapasitas AWS ParallelCluster Amazon untuk ML.

Untuk informasi lebih lanjut tentang AWS ParallelCluster, lihat Apa itu AWS ParallelCluster.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pantau perubahan status

Harga dan penagihan

Blok Kapasitas untuk ML

Topik

Platform yang didukung

Pertimbangan

Sumber daya terkait

catatan