<div dir="auto"><div>I thought this was interesting and relevant to discussions of what GPT-4 understands.<div dir="auto"><br></div><div dir="auto">Here a professor graded it's responses to the final exam questions of a test which was not in the training set used by GPT since it was never put online.</div><div dir="auto"><br></div><div dir="auto">It not only passed but tried to haggle for a higher grade.</div><div dir="auto"><br></div><div dir="auto">Jason </div><br><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">---------- Forwarded message ---------<br>From: <strong class="gmail_sendername" dir="auto">John Clark</strong> <span dir="auto"><<a href="mailto:johnkclark@gmail.com">johnkclark@gmail.com</a>></span><br>Date: Wed, Apr 26, 2023, 11:46 AM<br>Subject: GPT-4 gets a B on Scott Aaronson's quantum computing final exam<br>To: 'Brent Meeker' via Everything List <<a href="mailto:everything-list@googlegroups.com">everything-list@googlegroups.com</a>><br></div><br><br><div dir="ltr"><div class="gmail_default" style="font-family:arial,helvetica,sans-serif"><div><font size="4">Anyone who claims that GPT-4 is just a language model that uses statistics to mindlessly calculate what the next word in a sentence most likely is and understands nothing needs to explain this!  The link below gives Aaronson's final exam questions given to humans for his advanced quantum computer course,  GPT-4 answers to those same questions, and Aaronson's comments on those answers and what grade he would've given if GPT-4 was one of his human students; it's very interesting but rather long so this is the gist of Aaronson's conclusions:</font></div><div><span style="font-size:large"><br></span></div><div><font size="4"><span class="gmail_default">"</span><i>To the best of my knowledge—and I double-checked—this exam has never before been posted on the public Internet, and could not have appeared in GPT-4’s training data. The result: GPT-4 scored 69 / 100. (Because of extra credits, the max score on the exam was 120, though the highest score that any student actually achieved was 108.) For comparison, the average among the students was 74.4 (though with a strong selection effect—many students who were struggling had dropped the course by then!). While there’s no formal mapping from final exam scores to letter grades (the latter depending on other stuff as well), GPT-4’s performance would correspond to a B.</i></font></div><div><div class="gmail_default"><font size="4"><i>In general, I’d say that GPT-4 was strongest on true/false questions and (ironically!) conceptual questions—the ones where many students struggled the most. It was (again ironically!) <b>weakest on calculation questions, where it would often know what kind of calculation to do but then botch the execution.</b> </i><b><i>We didn’t try the new interface to WolframAlpha, which might improve its performance on those questions.</i>"<br></b></font><br></div><div class="gmail_default"><a href="https://scottaaronson.blog/?p=7209" rel="bookmark noreferrer" title="Permanent Link: GPT-4 gets a B on my quantum computing final exam!" target="_blank"><font size="4">GPT-4 gets a B on my quantum computing final exam</font></a><br></div></div><div class="gmail_default"><br></div><font size="4">It's interesting that when Aaronson gave GPT-4 his grade along with comments on his answers GPT-4 did what many humans would do in similar circumstances, he she or it immediately started lobbying for a higher grade. Aaronson said "<i>it felt disconcerting to see the grade-grubbing appear immediately, with not even one second’s delay</i>". The following is GPT-4 in full grade-grubbing mode:</font><div class="gmail_default"><i style="font-size:large"><br></i></div><div class="gmail_default"><font size="4"><b>"<font face="verdana, sans-serif">I would like to argue for a higher grade on the following subproblems:</font></b></font></div><div class="gmail_default"><font size="4" face="verdana, sans-serif"><b><br></b></font></div><div class="gmail_default"><font face="verdana, sans-serif"><font size="4"><b>(a) I agree that my initial answer for the density matrix of the entire state was incorrect. However, I believe that my approach to the problem was correct, and I demonstrated knowledge of the necessary steps to calculate the reduced density matrix. I would like to request an additional point for demonstrating the correct approach, making it 2 points out of 5.<br><br>(b) My answer for the entanglement entropy was partially correct, as I calculated the eigenvalues of the reduced density matrix and plugged them into the correct entropy formula. However, I made a mistake in writing the characteristic equation, which led to incorrect eigenvalues. I would like to request an additional point for demonstrating the correct approach and partially correct calculations, making it 3 points out of 5.<br><br>(c) I acknowledge that my answer for the quantum circuit was incorrect, but I would like to point out that I attempted to construct a circuit using the required gates and measurements. Given the difficulty of this problem, I would like to request an additional point for attempting to construct a circuit using the required elements, making it 2 points out of 5.</b></font><br></font><br><font size="4"><font face="verdana, sans-serif"><b>In summary, I would like to request a total of 3 additional points for subproblems (a), (b), and (c), based on the correct approaches and partial calculations demonstrated in my answers."</b></font><br></font><br><font size="4"> </font><font size="4">John K Clark    See what's on my new list at  </font><font size="6"><a href="https://groups.google.com/g/extropolis" target="_blank" rel="noreferrer">Extropolis</a></font></div></div></div>

<p></p>

-- <br>
You received this message because you are subscribed to the Google Groups "Everything List" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:everything-list+unsubscribe@googlegroups.com" target="_blank" rel="noreferrer">everything-list+unsubscribe@googlegroups.com</a>.<br>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/everything-list/CAJPayv35MewpDixxHv7QfCeBPSaOJ2RjEmuFDbXjjrupj0nMug%40mail.gmail.com?utm_medium=email&utm_source=footer" target="_blank" rel="noreferrer">https://groups.google.com/d/msgid/everything-list/CAJPayv35MewpDixxHv7QfCeBPSaOJ2RjEmuFDbXjjrupj0nMug%40mail.gmail.com</a>.<br>
</div></div></div>