مطالعهای نشان داد مدلهای پیشرفته هوش مصنوعی مانند GPT-4 توربو با دقت ۴۶ درصدی در آزمونهای چهارگزینهای تاریخ جهانی، عملکردی بهتر از حد تصادفی دارند اما همچنان از سطح تخصصی فاصله زیادی دارند. این مدلها در تشخیص حقایق ساده توانمند هستند اما در تحلیل دادههای پیچیده و مناطق کمتر مستند مانند آفریقای سیاه و اقیانوسیه چالش دارند.
پژوهشگران با استفاده از بانک اطلاعاتی تاریخ جهانی سشات تلاش کردند تا نقاط ضعف و قوت این ابزارها را برای تحقیقات تاریخی آشکار کنند. نتایج نشان داد هوش مصنوعی برای تحلیلهای پیشرفته تاریخی نیازمند بهبود قابلتوجه است، بهویژه از نظر تنوع دادههای آموزشی و توانایی درک استنتاجهای غیرمستقیم.