چتباتهای هوش مصنوعی میتوانند دروغهای قانعکنندهای به شما ارائه دهند
دیجیاتو/شرکت آنتروپیک که عمده شهرتش را مدیون چتبات کلود است، بررسی کرده که آیا مدلهای استدلالگر حقیقت را درباره چگونگی رسیدن به پاسخها میگویند یا اینکه بیسروصدا اسرار خود را حفظ میکنند. نتایج این آزمایش میتواند حیرتانگیر باشد. محققان برای آزمایش «وفاداری» در عملکرد، آزمایشهای متعددی روی مدل