
Anthropic چارچوبهای جدید سیاستگذاری هوش مصنوعی را با افزایش قابلیتهای سیستمهای پیشرفته پیشنهاد کرده است.
این شرکت میخواهد دولتها قوانینی برای مدلهای پیشگام تعیین کنند و کارگران را برای تأثیر اقتصادی هوش مصنوعی آماده کنند. طرح آن شامل استقرار خطرناک، آزمایش مستقل، امنیت سایبری و تابآوری عمومی میشود.
Anthropic دو پیشنهاد را تحت عنوان طرح «سیاستگذاری در مورد رشد نمایی هوش مصنوعی» خود ارائه کرد. چارچوب هوش مصنوعی پیشرفته بر مدلهای قدرتمند تمرکز دارد، در حالی که چارچوب سیاست اقتصادی به کارگران و منافع مالی مشترک میپردازد. این شرکت استدلال کرد که هوش مصنوعی اکنون سریعتر از سیستمهای فعلی سیاستگذاری حرکت میکند. همچنین گفت که دولتها برای جلوگیری یا ممانعت از استقرار مدلهای خطرناک به اختیارات نیاز دارند.
بر اساس این طرح، جریمههای مدنی با درآمد سالانه جهانی مرتبط خواهند بود. بر اساس چارچوب پیشنهادی، تخلفات مکرر جریمههای بالاتری را به همراه خواهند داشت. این چارچوب همچنین از توسعهدهندگان پیشگام میخواهد که مدلها را قبل از انتشار آزمایش کنند. توسعهدهندگان باید خلاصهها، چارچوبهای ایمنی و کارتهای سیستمی را برای سیستمهای قدرتمند هوش مصنوعی منتشر کنند.
ارزیابان مستقل آزمایشهای مدل و گزارشهای خطر را بررسی خواهند کرد. Anthropic همچنین از توسعهدهندگان میخواهد که برنامههای امنیتی قوی را برای وزن مدلها و سیستمهای آموزشی حفظ کنند. این پیشنهاد از قوانین شفافیت در ایالتهایی مانند کالیفرنیا و نیویورک حمایت میکند. با این حال، این شرکت استدلال کرد که افشای عمومی به تنهایی دیگر با سرعت توسعه هوش مصنوعی مطابقت ندارد.
قوانین پیشنهادی فقط برای پیشرفتهترین سیستمهای هوش مصنوعی اعمال میشود. Anthropic آستانه را برای مدلهای آموزشدیده با بیش از ۱۰ به توان ۲۵ عملیات ممیز شناور تعیین کرد. این چارچوب همچنین شرکتهایی را که بیش از ۵۰۰ میلیون دلار درآمد مرتبط با هوش مصنوعی دارند، پوشش میدهد. شرکتهایی که بیش از ۱ میلیارد دلار برای تحقیق و توسعه هوش مصنوعی هزینه میکنند نیز تحت پوشش آن قرار میگیرند.
Anthropic چهار حوزه اصلی خطر را در این پیشنهاد نام برد. این موارد شامل خطر بیولوژیکی، خطر سایبری، از دست دادن کنترل و تحقیقات خودکار هوش مصنوعی است. در مورد خطر بیولوژیکی، این شرکت هشدار داد که سیستمهای ناامن میتوانند به مهاجمان در توسعه ویروسهای مضر کمک کنند. همچنین خاطرنشان کرد که ابزارهای مشابه هوش مصنوعی میتوانند از کشف دارو حمایت کنند.
در مورد خطر سایبری، مدلهای پیشگام میتوانند نقصهای جدی نرمافزاری را در مقیاس بزرگ پیدا کنند. Anthropic گفت که این قابلیتها نگرانیهایی را برای بیمارستانها، شبکههای انرژی و سایر سیستمهای کلیدی ایجاد میکند. این شرکت همچنین خطرات ناشی از سیستمهایی که خارج از کنترل توسعهدهنده عمل میکنند را برجسته کرد. تحقیقات خودکار هوش مصنوعی در صورت عدم وجود تدابیر حفاظتی، میتواند خطرات بیولوژیکی، سایبری و کنترل را افزایش دهد.
Anthropic از توسعهدهندگان پیشگام میخواهد که گزارشهای خطر منظم منتشر کنند. این گزارشها وضعیت کلی خطر توسعهدهنده و کار ایمنی مدل را شرح میدهند. این چارچوب همچنین خواستار حداقل یک ارزیاب مستقل واجد شرایط است. این ارزیاب ارزیابیهای شرکت را بررسی کرده و یافتههای خود را در گزارشهای خطر مدل منتشر خواهد کرد.
دولتها و صنعت نیز استانداردهایی را برای این ارزیابان تعیین خواهند کرد. این پیشنهاد میگوید که ارزیابان به بودجه و دسترسی به مدلهای پیشگام نیاز دارند. قوانین امنیتی بخش اصلی دیگری از این چارچوب را تشکیل میدهد. توسعهدهندگان باید کل محیط توسعه خود را از مهاجمان خارجی و تهدیدات داخلی محافظت کنند.
شرکتها برنامههای امنیتی خود را به طور عمومی در سطح بالا توصیف خواهند کرد. آنها همچنین در صورت درخواست، جزئیات بیشتری را با یک آژانس دولتی تعیینشده به اشتراک خواهند گذاشت. Anthropic گفت که سیاستگذاران میتوانند با قوانین سبکتر شروع کنند و آنها را به مرور زمان تنظیم کنند. این چارچوب میگوید که مقررات باید از قابلیتهای مدل و استانداردهای ارزیابی پیروی کند.
بخش دوم این چارچوب بر تابآوری عمومی تمرکز دارد. Anthropic برنامهریزی قویتری را برای خطرات هوش مصنوعی مرتبط با زیستشناسی، سایبر و کنترل توصیه کرد. برای زیستشناسی، این پیشنهاد شامل غربالگری سنتز ژن و نظارت بیولوژیکی هشدار اولیه است. همچنین به ذخیرهسازی تجهیزات حفاظتی و ابزارهایی برای کاهش انتقال هوابرد اشاره میکند.
برای سایبر، این چارچوب خواستار نرمافزار اینترنتی قویتر و پشتیبانی از اپراتورهای زیرساختهای حیاتی است. همچنین توصیه میکند که سیستمهای قدیمی در زیرساختهای ضروری جایگزین شوند. دولتها نیز باید قابلیتهای سایبری پیشگام را از طریق یک عملکرد اختصاصی ردیابی کنند. Anthropic کار مشترک بین دولت و صنعت را در مورد تدابیر حفاظتی مدل پیشنهاد کرد.
این شرکت گفت که کار بر روی از دست دادن کنترل و خطرات تحقیقات خودکار هنوز کمتر توسعه یافته است. این خواستار ابزارهای بهتری برای شناسایی، مهار یا خاموش کردن سیستمهای ناامن شد. Anthropic از سیاستگذاران خواست تا با ادامه بهبود قابلیتهای مدل، اقدام کنند. این شرکت گفت که حاکمیت هوش مصنوعی باید با فناوری همگام باشد.