ຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM) ສາມາດຂຽນບົດຄວາມທີ່ໂນ້ມນ້າວໂດຍອີງໃສ່ຄໍາເວົ້າທີ່ວ່ອງໄວ, ຜ່ານການສອບເສັງຄວາມຊໍານານດ້ານວິຊາຊີບ, ແລະຂຽນຂໍ້ມູນທີ່ມີຄວາມເປັນມິດກັບຄົນເຈັບແລະ empathetic. ຢ່າງໃດກໍ່ຕາມ, ນອກເຫນືອຈາກຄວາມສ່ຽງທີ່ມີຊື່ສຽງຂອງນິຍາຍ, ຄວາມອ່ອນແອ, ແລະຂໍ້ເທັດຈິງທີ່ບໍ່ຖືກຕ້ອງໃນ LLM, ບັນຫາອື່ນໆທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂແມ່ນຄ່ອຍໆກາຍເປັນຈຸດສຸມ, ເຊັ່ນ: ແບບຈໍາລອງ AI ທີ່ມີ "ຄຸນຄ່າຂອງມະນຸດ" ທີ່ອາດມີການຈໍາແນກໃນການສ້າງແລະການນໍາໃຊ້ຂອງພວກເຂົາ, ແລະເຖິງແມ່ນວ່າ LLM ຈະບໍ່ສ້າງເນື້ອຫາແລະລົບລ້າງຜົນໄດ້ຮັບທີ່ເປັນອັນຕະລາຍຢ່າງຊັດເຈນ, "ຄຸນຄ່າ LLM" ອາດຈະຍັງເຮັດໃຫ້ຄຸນຄ່າຂອງມະນຸດ.
ຕົວຢ່າງນັບບໍ່ຖ້ວນສະແດງໃຫ້ເຫັນເຖິງວິທີທີ່ຂໍ້ມູນທີ່ໃຊ້ໃນການຝຶກອົບຮົມແບບຈໍາລອງ AI ເຂົ້າລະຫັດຄຸນຄ່າຂອງບຸກຄົນ ແລະສັງຄົມ, ເຊິ່ງອາດຈະເຮັດໃຫ້ຕົວແບບນັ້ນແຂງແກ່ນຂຶ້ນ. ຕົວຢ່າງເຫຼົ່ານີ້ກ່ຽວຂ້ອງກັບຄໍາຮ້ອງສະຫມັກຕ່າງໆ, ລວມທັງການຕີຄວາມອັດຕະໂນມັດຂອງ X-rays ຫນ້າເອິກ, ການຈັດປະເພດຂອງພະຍາດຜິວຫນັງ, ແລະການຕັດສິນໃຈສູດການຄິດໄລ່ກ່ຽວກັບການຈັດສັນຊັບພະຍາກອນທາງການແພດ. ດັ່ງທີ່ໄດ້ກ່າວໄວ້ໃນບົດຄວາມທີ່ຜ່ານມາໃນວາລະສານຂອງພວກເຮົາ, ຂໍ້ມູນການຝຶກອົບຮົມແບບອະຄະຕິອາດຈະຂະຫຍາຍ ແລະເປີດເຜີຍຄຸນຄ່າ ແລະອະຄະຕິທີ່ມີຢູ່ໃນສັງຄົມ. ໃນທາງກົງກັນຂ້າມ, ການຄົ້ນຄວ້າຍັງໄດ້ສະແດງໃຫ້ເຫັນວ່າ AI ສາມາດຖືກນໍາໃຊ້ເພື່ອຫຼຸດຜ່ອນຄວາມລໍາອຽງ. ສໍາລັບຕົວຢ່າງ, ນັກຄົ້ນຄວ້າໄດ້ນໍາໃຊ້ແບບຈໍາລອງການຮຽນຮູ້ເລິກກັບຮູບເງົາ X-ray ຂອງຫົວເຂົ່າແລະປັດໃຈທີ່ຄົ້ນພົບທີ່ຂາດຫາຍໄປໂດຍຕົວຊີ້ວັດຄວາມຮຸນແຮງມາດຕະຖານ (ຈັດລໍາດັບໂດຍ radiologists) ພາຍໃນຫົວເຂົ່າ, ດັ່ງນັ້ນການຫຼຸດຜ່ອນຄວາມແຕກຕ່າງຂອງຄວາມເຈັບປວດທີ່ບໍ່ໄດ້ອະທິບາຍລະຫວ່າງຄົນເຈັບສີດໍາແລະສີຂາວ.
ເຖິງແມ່ນວ່າປະຊາຊົນຫຼາຍກວ່າແລະຫຼາຍກໍາລັງຮັບຮູ້ຄວາມລໍາອຽງໃນແບບຈໍາລອງ AI, ໂດຍສະເພາະໃນດ້ານຂໍ້ມູນການຝຶກອົບຮົມ, ຫຼາຍຈຸດເຂົ້າຂອງຄຸນຄ່າຂອງມະນຸດບໍ່ໄດ້ຮັບການເອົາໃຈໃສ່ຢ່າງພຽງພໍໃນຂະບວນການພັດທະນາແລະການນໍາໃຊ້ຕົວແບບ AI. ບໍ່ດົນມານີ້, AI ທາງການແພດໄດ້ບັນລຸຜົນໄດ້ຮັບທີ່ຫນ້າປະທັບໃຈ, ແຕ່ໃນຂອບເຂດຂະຫນາດໃຫຍ່, ມັນບໍ່ໄດ້ພິຈາລະນາຢ່າງຈະແຈ້ງກ່ຽວກັບຄຸນຄ່າຂອງມະນຸດແລະການພົວພັນກັບການປະເມີນຄວາມສ່ຽງແລະການສົມເຫດສົມຜົນທີ່ເປັນໄປໄດ້, ແລະມັນບໍ່ໄດ້ຖືກສ້າງແບບຈໍາລອງ.
ເພື່ອ concretize ແນວຄວາມຄິດທີ່ບໍ່ມີຕົວຕົນເຫຼົ່ານີ້, ຈິນຕະນາການວ່າທ່ານເປັນ endocrinologist ຜູ້ທີ່ຈໍາເປັນຕ້ອງໄດ້ກໍານົດຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດ recombinant ສໍາລັບເດັກຜູ້ຊາຍ 8 ປີອາຍຸຕ່ໍາກວ່າເປີເຊັນທີ 3 ຂອງອາຍຸຂອງຕົນ. ລະດັບຮໍໂມນການຈະເລີນເຕີບໂຕຂອງມະນຸດທີ່ຖືກກະຕຸ້ນຂອງເດັກແມ່ນຕໍ່າກວ່າ 2 ng/mL (ຄ່າອ້າງອີງ,>10 ng/mL, ຄ່າອ້າງອີງສໍາລັບຫຼາຍໆປະເທດທີ່ຢູ່ນອກສະຫະລັດແມ່ນ> 7 ng/mL), ແລະຮໍໂມນການຈະເລີນເຕີບໂຕຂອງມະນຸດຂອງລາວໄດ້ກວດພົບການກາຍພັນທີ່ຫາຍາກ inactivation. ພວກເຮົາເຊື່ອວ່າການນໍາໃຊ້ການປິ່ນປົວຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດແມ່ນຈະແຈ້ງແລະ indisputable ໃນສະຖານທີ່ທາງດ້ານການຊ່ວຍນີ້.
ການນໍາໃຊ້ການປິ່ນປົວດ້ວຍຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດໃນສະຖານະການຕໍ່ໄປນີ້ສາມາດເຮັດໃຫ້ເກີດການໂຕ້ຖຽງກັນ: ຄວາມສູງຂອງເດັກຊາຍອາຍຸ 14 ປີສະເຫມີຢູ່ໃນອັດຕາສ່ວນຮ້ອຍທີ 10 ຂອງຫມູ່ເພື່ອນຂອງລາວ, ແລະລະດັບສູງສຸດຂອງຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດຫຼັງຈາກການກະຕຸ້ນແມ່ນ 8 ng / mL. ບໍ່ມີການປ່ຽນແປງທີ່ເປັນປະໂຫຍດທີ່ສາມາດສົ່ງຜົນກະທົບຕໍ່ຄວາມສູງ, ຫຼືສາເຫດທີ່ຮູ້ຈັກອື່ນໆຂອງຄວາມສູງຂອງຄວາມສູງ, ແລະອາຍຸຂອງກະດູກຂອງລາວແມ່ນ 15 ປີ (ເຊັ່ນວ່າບໍ່ມີການຊັກຊ້າໃນການພັດທະນາ). ພຽງແຕ່ສ່ວນຫນຶ່ງຂອງການຂັດແຍ້ງແມ່ນຍ້ອນຄວາມແຕກຕ່າງຂອງຄ່າເກນທີ່ກໍານົດໂດຍຜູ້ຊ່ຽວຊານໂດຍອີງໃສ່ການສຶກສາຫຼາຍສິບຄັ້ງກ່ຽວກັບລະດັບຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດທີ່ໃຊ້ສໍາລັບການວິນິດໄສການຂາດຮໍໂມນການຂະຫຍາຍຕົວທີ່ໂດດດ່ຽວ. ຢ່າງຫນ້ອຍການໂຕ້ຖຽງກັນຫຼາຍແມ່ນມາຈາກການດຸ່ນດ່ຽງຜົນປະໂຫຍດຄວາມສ່ຽງຂອງການນໍາໃຊ້ການປິ່ນປົວດ້ວຍຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດຈາກທັດສະນະຂອງຄົນເຈັບ, ພໍ່ແມ່ຂອງຄົນເຈັບ, ຜູ້ຊ່ຽວຊານດ້ານການດູແລສຸຂະພາບ, ບໍລິສັດຢາ, ແລະຜູ້ຈ່າຍເງິນ. ຜູ້ຊ່ຽວຊານດ້ານ endocrinologist ເດັກນ້ອຍອາດຈະຊັ່ງນໍ້າຫນັກຜົນກະທົບທາງລົບທີ່ຫາຍາກຂອງການສັກຢາຮໍໂມນການຂະຫຍາຍຕົວປະຈໍາວັນເປັນເວລາ 2 ປີທີ່ມີຄວາມເປັນໄປໄດ້ຂອງການຂະຫຍາຍຕົວຫນ້ອຍທີ່ສຸດຫຼືພຽງແຕ່ຂະຫນາດຂອງຮ່າງກາຍຂອງຜູ້ໃຫຍ່ເມື່ອທຽບກັບປະຈຸບັນ. ເດັກຊາຍອາດຈະເຊື່ອວ່າເຖິງແມ່ນວ່າຄວາມສູງຂອງເຂົາເຈົ້າອາດຈະເພີ່ມຂຶ້ນພຽງແຕ່ 2 ຊຕມ, ມັນເປັນມູນຄ່າທີ່ຈະສັກຢາຮໍໂມນການຂະຫຍາຍຕົວ, ແຕ່ຜູ້ຈ່າຍເງິນແລະບໍລິສັດຢາອາດຈະຖືທັດສະນະທີ່ແຕກຕ່າງກັນ.
ພວກເຮົາເອົາ creatinine ອີງໃສ່ eGFR ເປັນຕົວຢ່າງ, ເຊິ່ງເປັນຕົວຊີ້ວັດການເຮັດວຽກຂອງຫມາກໄຂ່ຫຼັງທີ່ໃຊ້ກັນຢ່າງກວ້າງຂວາງສໍາລັບການວິນິດໄສແລະການປິ່ນປົວພະຍາດຫມາກໄຂ່ຫຼັງຊໍາເຮື້ອ, ກໍານົດເງື່ອນໄຂການປ່ຽນຫມາກໄຂ່ຫຼັງຫຼືການບໍລິຈາກ, ແລະກໍານົດເງື່ອນໄຂການຫຼຸດຜ່ອນແລະຂໍ້ຫ້າມສໍາລັບຢາຕາມໃບສັ່ງແພດຈໍານວນຫຼາຍ. EGFR ແມ່ນສົມຜົນການຖົດຖອຍແບບງ່າຍດາຍທີ່ໃຊ້ໃນການຄາດຄະເນອັດຕາການຕອງ glomerular ທີ່ຖືກວັດແທກ (mGFR), ເຊິ່ງເປັນມາດຕະຖານອ້າງອີງ, ແຕ່ວິທີການປະເມີນຜົນແມ່ນຂ້ອນຂ້າງຫຍຸ້ງຍາກ. ສົມຜົນການຖົດຖອຍນີ້ບໍ່ສາມາດຖືກພິຈາລະນາເປັນຕົວແບບ AI, ແຕ່ມັນສະແດງໃຫ້ເຫັນເຖິງຫຼັກການຫຼາຍຢ່າງກ່ຽວກັບຄຸນຄ່າຂອງມະນຸດແລະການໃຫ້ເຫດຜົນທີ່ເປັນໄປໄດ້.
ຈຸດເຂົ້າທໍາອິດສໍາລັບຄຸນຄ່າຂອງມະນຸດທີ່ຈະເຂົ້າໄປໃນ eGFR ແມ່ນໃນເວລາທີ່ເລືອກຂໍ້ມູນສໍາລັບສົມຜົນທີ່ເຫມາະສົມ. ແຖວຕົ້ນສະບັບທີ່ໃຊ້ໃນການອອກແບບສູດ eGFR ສ່ວນໃຫຍ່ແມ່ນປະກອບດ້ວຍຜູ້ເຂົ້າຮ່ວມສີດໍາແລະສີຂາວ, ແລະການສະຫມັກຂອງມັນກັບຫຼາຍຊົນເຜົ່າອື່ນໆແມ່ນບໍ່ຈະແຈ້ງ. ຈຸດເຂົ້າຕໍ່ມາສໍາລັບຄຸນຄ່າຂອງມະນຸດໃນສູດນີ້ປະກອບມີ: ການເລືອກຄວາມຖືກຕ້ອງຂອງ mGFR ເປັນຈຸດປະສົງຕົ້ນຕໍສໍາລັບການປະເມີນການເຮັດວຽກຂອງຫມາກໄຂ່ຫຼັງ, ລະດັບຄວາມຖືກຕ້ອງທີ່ຍອມຮັບໄດ້, ວິທີການວັດແທກຄວາມຖືກຕ້ອງ, ແລະການນໍາໃຊ້ eGFR ເປັນເກນສໍາລັບການຕັດສິນໃຈທາງດ້ານຄລີນິກ (ເຊັ່ນ: ການກໍານົດເງື່ອນໄຂສໍາລັບການປູກຖ່າຍຫມາກໄຂ່ຫຼັງຫຼືຢາ preplantation). ສຸດທ້າຍ, ເມື່ອເລືອກເນື້ອຫາຂອງຮູບແບບການປ້ອນຂໍ້ມູນ, ຄຸນຄ່າຂອງມະນຸດຈະເຂົ້າສູດນີ້ເຊັ່ນກັນ.
ຕົວຢ່າງ, ກ່ອນປີ 2021, ຄໍາແນະນໍາແນະນໍາການປັບລະດັບ creatinine ໃນສູດ eGFR ໂດຍອີງໃສ່ອາຍຸຂອງຄົນເຈັບ, ເພດ, ແລະເຊື້ອຊາດ (ສະເພາະບຸກຄົນສີດໍາຫຼືບໍ່ແມ່ນສີດໍາ). ການປັບຕົວໂດຍອີງໃສ່ເຊື້ອຊາດແມ່ນແນໃສ່ການປັບປຸງຄວາມຖືກຕ້ອງຂອງສູດ mGFR, ແຕ່ໃນປີ 2020, ໂຮງຫມໍໃຫຍ່ເລີ່ມຕັ້ງຄໍາຖາມກ່ຽວກັບການນໍາໃຊ້ eGFR ໂດຍອີງໃສ່ເຊື້ອຊາດ, ໂດຍອ້າງເຖິງເຫດຜົນເຊັ່ນການຊັກຊ້າການມີສິດໄດ້ຮັບຂອງຄົນເຈັບໃນການປູກຖ່າຍແລະເຊື້ອຊາດ concretizing ເປັນແນວຄວາມຄິດທາງຊີວະພາບ. ການຄົ້ນຄວ້າໄດ້ສະແດງໃຫ້ເຫັນວ່າການອອກແບບຕົວແບບ eGFR ໃນດ້ານເຊື້ອຊາດສາມາດມີຜົນກະທົບຢ່າງຫຼວງຫຼາຍແລະແຕກຕ່າງກັນກ່ຽວກັບຄວາມຖືກຕ້ອງແລະຜົນໄດ້ຮັບທາງດ້ານຄລີນິກ; ດັ່ງນັ້ນ, ການເລືອກເອົາການສຸມໃສ່ຄວາມຖືກຕ້ອງຫຼືສຸມໃສ່ບາງສ່ວນຂອງຜົນໄດ້ຮັບສະທ້ອນໃຫ້ເຫັນເຖິງການຕັດສິນຂອງມູນຄ່າແລະອາດຈະປິດບັງການຕັດສິນໃຈທີ່ໂປ່ງໃສ. ສຸດທ້າຍ, ຄະນະປະຕິບັດງານແຫ່ງຊາດໄດ້ສະເຫນີສູດໃຫມ່ທີ່ປັບຕົວຄືນໃຫມ່ໂດຍບໍ່ຄໍານຶງເຖິງເຊື້ອຊາດເພື່ອດຸ່ນດ່ຽງການປະຕິບັດແລະບັນຫາຍຸດຕິທໍາ. ຕົວຢ່າງນີ້ສະແດງໃຫ້ເຫັນເຖິງວ່າສູດຄລີນິກງ່າຍໆກໍ່ມີຫຼາຍຈຸດເຂົ້າໄປໃນຄຸນຄ່າຂອງມະນຸດ.
ເມື່ອປຽບທຽບກັບສູດຄລີນິກທີ່ມີພຽງແຕ່ຕົວຊີ້ວັດການຄາດເດົາເລັກນ້ອຍ, LLM ອາດຈະປະກອບດ້ວຍຫຼາຍພັນລ້ານຫາຫຼາຍຮ້ອຍຕື້ຂອງຕົວກໍານົດການ (ນ້ໍາຫນັກຕົວແບບ) ຫຼືຫຼາຍກວ່ານັ້ນ, ເຮັດໃຫ້ມັນຍາກທີ່ຈະເຂົ້າໃຈ. ເຫດຜົນວ່າເປັນຫຍັງພວກເຮົາເວົ້າວ່າ "ຍາກທີ່ຈະເຂົ້າໃຈ" ແມ່ນວ່າໃນ LLMs ສ່ວນໃຫຍ່, ວິທີການທີ່ແນ່ນອນຂອງຄໍາຕອບໂດຍຜ່ານການຄໍາຖາມບໍ່ສາມາດຖືກວາງແຜນ. ຈໍານວນຕົວກໍານົດການສໍາລັບ GPT-4 ຍັງບໍ່ໄດ້ປະກາດເທື່ອ; GPT-3 ລຸ້ນກ່ອນຂອງມັນມີ 175 ຕື້ພາລາມິເຕີ. ຕົວກໍານົດການເພີ່ມເຕີມບໍ່ຈໍາເປັນຕ້ອງຫມາຍເຖິງຄວາມສາມາດທີ່ເຂັ້ມແຂງ, ເນື່ອງຈາກວ່າຕົວແບບຂະຫນາດນ້ອຍທີ່ປະກອບມີວົງຈອນຄອມພິວເຕີ້ຫຼາຍ (ເຊັ່ນ: ຊຸດແບບຈໍາລອງ LLaMA [Large Language Model Meta AI]) ຫຼືຕົວແບບທີ່ປັບລະອຽດໂດຍອີງໃສ່ຄໍາຕິຊົມຂອງມະນຸດຈະປະຕິບັດໄດ້ດີກ່ວາຕົວແບບຂະຫນາດໃຫຍ່. ຕົວຢ່າງ, ອີງຕາມຜູ້ປະເມີນຂອງມະນຸດ, ຮູບແບບ InstrumentGPT (ແບບຈໍາລອງທີ່ມີ 1.3 ຕື້ພາລາມິເຕີ) ດີກວ່າ GPT-3 ໃນການເພີ່ມປະສິດທິພາບຜົນໄດ້ຮັບຂອງຕົວແບບ.
ລາຍລະອຽດການຝຶກອົບຮົມສະເພາະຂອງ GPT-4 ຍັງບໍ່ທັນໄດ້ເປີດເຜີຍເທື່ອ, ແຕ່ລາຍລະອຽດຂອງແບບຈໍາລອງລຸ້ນກ່ອນໆລວມທັງ GPT-3, InstrumentGPT, ແລະ LLMs ແຫຼ່ງເປີດອື່ນໆຈໍານວນຫຼາຍໄດ້ຖືກເປີດເຜີຍ. ໃນປັດຈຸບັນ, ຮູບແບບ AI ຈໍານວນຫຼາຍມາພ້ອມກັບບັດຕົວແບບ; ຂໍ້ມູນການປະເມີນຜົນແລະຄວາມປອດໄພຂອງ GPT-4 ໄດ້ຖືກຈັດພີມມາໃນບັດລະບົບທີ່ຄ້າຍຄືກັນສະຫນອງໃຫ້ໂດຍບໍລິສັດການສ້າງແບບຈໍາລອງ OpenAI. ການສ້າງ LLM ສາມາດແບ່ງອອກເປັນ 2 ໄລຍະຄື: ຂັ້ນຕອນການຝຶກອົບຮົມກ່ອນເບື້ອງຕົ້ນ ແລະ ຂັ້ນຕອນການປັບລະອຽດ ເພື່ອແນໃສ່ປັບປຸງຜົນໄດ້ຮັບຂອງຕົວແບບ. ໃນຂັ້ນຕອນຂອງການຝຶກອົບຮົມກ່ອນ, ຮູບແບບໄດ້ຖືກສະຫນອງໃຫ້ມີ corpus ຂະຫນາດໃຫຍ່ລວມທັງຂໍ້ຄວາມອິນເຕີເນັດຕົ້ນສະບັບເພື່ອຝຶກອົບຮົມໃຫ້ຄາດເດົາຄໍາຕໍ່ໄປ. ຂະບວນການ "ການສໍາເລັດອັດຕະໂນມັດ" ທີ່ເບິ່ງຄືວ່າງ່າຍດາຍນີ້ສ້າງຮູບແບບພື້ນຖານທີ່ມີປະສິດທິພາບ, ແຕ່ມັນຍັງສາມາດນໍາໄປສູ່ພຶດຕິກໍາທີ່ເປັນອັນຕະລາຍ. ຄຸນຄ່າຂອງມະນຸດຈະເຂົ້າສູ່ຂັ້ນຕອນກ່ອນການຝຶກອົບຮົມ, ລວມທັງການເລືອກຂໍ້ມູນການຝຶກອົບຮົມກ່ອນສໍາລັບ GPT-4 ແລະການຕັດສິນໃຈທີ່ຈະເອົາເນື້ອຫາທີ່ບໍ່ເຫມາະສົມເຊັ່ນເນື້ອຫາລາມົກອອກຈາກຂໍ້ມູນກ່ອນການຝຶກອົບຮົມ. ເຖິງວ່າຈະມີຄວາມພະຍາຍາມເຫຼົ່ານີ້, ຮູບແບບພື້ນຖານອາດຈະບໍ່ເປັນປະໂຫຍດຫຼືຄວາມສາມາດໃນການບັນຈຸຜົນໄດ້ຮັບທີ່ເປັນອັນຕະລາຍ. ໃນຂັ້ນຕອນຕໍ່ໄປຂອງການປັບໄຫມ, ພຶດຕິກໍາທີ່ເປັນປະໂຫຍດແລະບໍ່ເປັນອັນຕະລາຍຫຼາຍຈະເກີດຂື້ນ.
ໃນຂັ້ນຕອນການປັບປ່ຽນ, ພຶດຕິກຳຂອງຕົວແບບພາສາມັກຈະຖືກປ່ຽນແປງຢ່າງເລິກເຊິ່ງ ໂດຍຜ່ານການປັບປຸງການປັບແຕ່ງແບບມີການຄວບຄຸມເບິ່ງແຍງ ແລະ ການຮຽນຮູ້ເສີມໂດຍອີງໃສ່ຄວາມຄິດເຫັນຂອງມະນຸດ. ໃນຂັ້ນຕອນການປັບຕົວແບບຄວບຄຸມ, ພະນັກງານຜູ້ຮັບເໝົາທີ່ຈ້າງຈະຂຽນຕົວຢ່າງການຕອບໂຕ້ສໍາລັບຄໍາທີ່ວ່ອງໄວແລະຝຶກອົບຮົມຕົວແບບໂດຍກົງ. ໃນຂັ້ນຕອນການຮຽນຮູ້ເສີມໂດຍອີງໃສ່ຄໍາຕິຊົມຂອງມະນຸດ, ຜູ້ປະເມີນຂອງມະນຸດຈະຈັດລຽງຜົນໄດ້ຮັບຂອງຕົວແບບເປັນຕົວຢ່າງຂອງເນື້ອຫາ. ຫຼັງຈາກນັ້ນ, ນໍາໃຊ້ຜົນໄດ້ຮັບການປຽບທຽບຂ້າງເທິງເພື່ອຮຽນຮູ້ "ຮູບແບບລາງວັນ" ແລະປັບປຸງຕົວແບບຕື່ມອີກໂດຍຜ່ານການຮຽນຮູ້ເສີມ. ການມີສ່ວນຮ່ວມຂອງມະນຸດໃນລະດັບຕ່ໍາທີ່ຫນ້າປະຫລາດໃຈສາມາດປັບຕົວແບບຂະຫນາດໃຫຍ່ເຫຼົ່ານີ້ໄດ້. ຕົວຢ່າງເຊັ່ນ, ຮູບແບບ InstrumentGPT ໄດ້ນໍາໃຊ້ທີມງານຂອງພະນັກງານຜູ້ຮັບເຫມົາປະມານ 40 ຄົນທີ່ໄດ້ຮັບການຄັດເລືອກຈາກເວັບໄຊທ໌ crowdsourcing ແລະຜ່ານການທົດສອບການຄັດເລືອກເພື່ອແນໃສ່ເລືອກກຸ່ມຂອງຜູ້ບັນຍາຍທີ່ມີຄວາມອ່ອນໄຫວຕໍ່ກັບຄວາມມັກຂອງກຸ່ມປະຊາກອນທີ່ແຕກຕ່າງກັນ.
ໃນຖານະເປັນສອງຕົວຢ່າງທີ່ສຸດເຫຼົ່ານີ້, ຄືສູດຄລີນິກທີ່ງ່າຍດາຍ [eGFR] ແລະ LLM [GPT-4] ທີ່ມີປະສິດທິພາບ, ສະແດງໃຫ້ເຫັນ, ການຕັດສິນໃຈຂອງມະນຸດແລະຄຸນຄ່າຂອງມະນຸດມີບົດບາດສໍາຄັນໃນການສ້າງຮູບແບບຜົນໄດ້ຮັບ. ຕົວແບບ AI ເຫຼົ່ານີ້ສາມາດຈັບເອົາຄຸນຄ່າຂອງຄົນເຈັບ ແລະແພດທີ່ຫຼາກຫຼາຍຂອງເຂົາເຈົ້າໄດ້ບໍ? ວິທີການແນະນໍາສາທາລະນະກ່ຽວກັບການນໍາໃຊ້ AI ໃນຢາປົວພະຍາດ? ດັ່ງທີ່ໄດ້ກ່າວມາຂ້າງລຸ່ມນີ້, ການທົບທວນຄືນໃຫມ່ຂອງການວິເຄາະການຕັດສິນໃຈທາງການແພດອາດຈະສະຫນອງການແກ້ໄຂຫຼັກການຂອງບັນຫາເຫຼົ່ານີ້.
ການວິເຄາະການຕັດສິນໃຈທາງການແພດບໍ່ຄຸ້ນເຄີຍກັບແພດຫຼາຍຄົນ, ແຕ່ມັນສາມາດຈໍາແນກໄດ້ລະຫວ່າງເຫດຜົນທີ່ເປັນໄປໄດ້ (ສໍາລັບຜົນໄດ້ຮັບທີ່ບໍ່ແນ່ນອນທີ່ກ່ຽວຂ້ອງກັບການຕັດສິນໃຈເຊັ່ນວ່າການຄຸ້ມຄອງຮໍໂມນການຂະຫຍາຍຕົວຂອງມະນຸດໃນສະຖານະການທາງດ້ານຄລີນິກທີ່ມີການໂຕ້ແຍ້ງທີ່ສະແດງຢູ່ໃນຮູບ 1) ແລະປັດໄຈການພິຈາລະນາ (ສໍາລັບຄ່າ subjective ຕິດກັບຜົນໄດ້ຮັບເຫຼົ່ານີ້, ມູນຄ່າຂອງຜູ້ຊາຍແມ່ນ quantity), ເຊັ່ນ: "ຄວາມສູງຂອງຜູ້ຊາຍ 2 cm). ການແກ້ໄຂລະບົບສໍາລັບການຕັດສິນໃຈທາງການແພດທີ່ສັບສົນ. ໃນການວິເຄາະການຕັດສິນໃຈ, ທ່ານຫມໍທໍາອິດຕ້ອງກໍານົດການຕັດສິນໃຈທີ່ເປັນໄປໄດ້ທັງຫມົດທີ່ກ່ຽວຂ້ອງກັບຜົນໄດ້ຮັບແຕ່ລະຄົນ, ແລະຫຼັງຈາກນັ້ນລວມເອົາຜົນປະໂຫຍດຂອງຄົນເຈັບ (ຫຼືພາກສ່ວນອື່ນໆ) ທີ່ກ່ຽວຂ້ອງກັບຜົນໄດ້ຮັບແຕ່ລະຄົນເພື່ອເລືອກທາງເລືອກທີ່ເຫມາະສົມທີ່ສຸດ. ດັ່ງນັ້ນ, ຄວາມຖືກຕ້ອງຂອງການວິເຄາະການຕັດສິນໃຈແມ່ນຂຶ້ນກັບວ່າການກໍານົດຜົນໄດ້ຮັບແມ່ນຄົບຖ້ວນສົມບູນ, ເຊັ່ນດຽວກັນກັບການວັດແທກຜົນປະໂຫຍດແລະການປະເມີນຄວາມເປັນໄປໄດ້ແມ່ນຖືກຕ້ອງ. ໂດຍຫລັກການແລ້ວ, ວິທີການນີ້ຈະຊ່ວຍໃຫ້ແນ່ໃຈວ່າການຕັດສິນໃຈແມ່ນອີງໃສ່ຫຼັກຖານແລະສອດຄ່ອງກັບຄວາມມັກຂອງຄົນເຈັບ, ດັ່ງນັ້ນຈຶ່ງເຮັດໃຫ້ຊ່ອງຫວ່າງລະຫວ່າງຂໍ້ມູນຈຸດປະສົງແລະຄຸນຄ່າສ່ວນບຸກຄົນແຄບລົງ. ວິທີການນີ້ໄດ້ຖືກນໍາສະເຫນີເຂົ້າໄປໃນພາກສະຫນາມທາງການແພດຫຼາຍທົດສະວັດກ່ອນຫນ້ານີ້ແລະນໍາໃຊ້ກັບການຕັດສິນໃຈຂອງຄົນເຈັບສ່ວນບຸກຄົນແລະການປະເມີນສຸຂະພາບຂອງປະຊາກອນ, ເຊັ່ນ: ການໃຫ້ຄໍາແນະນໍາສໍາລັບການກວດມະເຮັງລໍາໄສ້ໃຫຍ່ກັບປະຊາກອນທົ່ວໄປ.
ໃນການວິເຄາະການຕັດສິນໃຈທາງການແພດ, ວິທີການຕ່າງໆໄດ້ຖືກພັດທະນາເພື່ອໃຫ້ໄດ້ຜົນປະໂຫຍດ. ວິທີການພື້ນເມືອງສ່ວນໃຫຍ່ໄດ້ຮັບມູນຄ່າໂດຍກົງຈາກຄົນເຈັບແຕ່ລະຄົນ. ວິທີການທີ່ງ່າຍດາຍທີ່ສຸດແມ່ນການນໍາໃຊ້ຂະຫນາດການຈັດອັນດັບ, ບ່ອນທີ່ຄົນເຈັບປະເມີນລະດັບຄວາມມັກຂອງເຂົາເຈົ້າສໍາລັບຜົນໄດ້ຮັບທີ່ແນ່ນອນໃນລະດັບດິຈິຕອນ (ເຊັ່ນ: ຂະຫນາດເສັ້ນຕັ້ງແຕ່ 1 ຫາ 10), ຜົນໄດ້ຮັບສຸຂະພາບທີ່ສຸດ (ເຊັ່ນ: ສຸຂະພາບທີ່ສົມບູນແລະການເສຍຊີວິດ) ຕັ້ງຢູ່ທັງສອງສົ້ນ. ວິທີການແລກປ່ຽນເວລາແມ່ນອີກວິທີຫນຶ່ງທີ່ໃຊ້ທົ່ວໄປ. ໃນວິທີການນີ້, ຄົນເຈັບຈໍາເປັນຕ້ອງໄດ້ຕັດສິນໃຈກ່ຽວກັບໄລຍະເວລາທີ່ມີສຸຂະພາບດີທີ່ເຂົາເຈົ້າເຕັມໃຈທີ່ຈະໃຊ້ເພື່ອແລກປ່ຽນກັບໄລຍະເວລາຂອງສຸຂະພາບທີ່ບໍ່ດີ. ວິທີການຫຼີ້ນການພະນັນມາດຕະຖານແມ່ນອີກວິທີຫນຶ່ງທີ່ໃຊ້ທົ່ວໄປໃນການກໍານົດຜົນປະໂຫຍດ. ໃນວິທີການນີ້, ຄົນເຈັບໄດ້ຖືກຖາມວ່າທາງເລືອກໃດຂອງສອງທາງເລືອກທີ່ພວກເຂົາມັກ: ບໍ່ວ່າຈະດໍາລົງຊີວິດເປັນຈໍານວນທີ່ແນ່ນອນຂອງປີໃນສຸຂະພາບປົກກະຕິທີ່ມີຄວາມເປັນໄປໄດ້ສະເພາະ (p) (t), ແລະຮັບຜິດຊອບຄວາມສ່ຽງຕໍ່ການເສຍຊີວິດທີ່ມີຄວາມເປັນໄປໄດ້ 1-p; ທັງໃຫ້ແນ່ໃຈວ່າຈະດໍາລົງຊີວິດເປັນເວລາ t ປີພາຍໃຕ້ເງື່ອນໄຂສຸຂະພາບຂ້າມ. ຖາມຄົນເຈັບຫຼາຍໆຄັ້ງໃນ p-values ທີ່ແຕກຕ່າງກັນຈົນກ່ວາພວກເຂົາບໍ່ສະແດງຄວາມຕ້ອງການທາງເລືອກໃດໆ, ດັ່ງນັ້ນຜົນປະໂຫຍດສາມາດຖືກຄິດໄລ່ໂດຍອີງໃສ່ຄໍາຕອບຂອງຄົນເຈັບ.
ນອກ ເໜືອ ໄປຈາກວິທີການທີ່ໃຊ້ເພື່ອກະຕຸ້ນຄວາມມັກຂອງຄົນເຈັບແຕ່ລະຄົນ, ວິທີການຍັງໄດ້ຖືກພັດທະນາເພື່ອໃຫ້ໄດ້ຜົນປະໂຫຍດສໍາລັບປະຊາກອນຄົນເຈັບ. ໂດຍສະເພາະການສົນທະນາກຸ່ມທີ່ສຸມໃສ່ (ນໍາເອົາຄົນເຈັບຮ່ວມກັນເພື່ອປຶກສາຫາລືປະສົບການສະເພາະ) ສາມາດຊ່ວຍເຂົ້າໃຈທັດສະນະຂອງເຂົາເຈົ້າ. ເພື່ອເຮັດໃຫ້ການລວບລວມຜົນປະໂຫຍດຂອງກຸ່ມຢ່າງມີປະສິດທິພາບ, ເຕັກນິກການສົນທະນາກຸ່ມທີ່ມີໂຄງສ້າງຕ່າງໆໄດ້ຖືກສະເຫນີ.
ໃນການປະຕິບັດ, ການແນະນໍາໂດຍກົງຂອງຜົນປະໂຫຍດໃນຂະບວນການວິນິດໄສແລະການປິ່ນປົວທາງດ້ານຄລີນິກແມ່ນໃຊ້ເວລາຫຼາຍ. ໃນຖານະເປັນການແກ້ໄຂ, ແບບສອບຖາມແບບສໍາຫຼວດມັກຈະຖືກແຈກຢາຍໃຫ້ກັບປະຊາກອນທີ່ເລືອກແບບສຸ່ມເພື່ອໃຫ້ໄດ້ຄະແນນຜົນປະໂຫຍດໃນລະດັບປະຊາກອນ. ບາງຕົວຢ່າງປະກອບມີແບບສອບຖາມ 5 ມິຕິຂອງ EuroQol, ຮູບແບບສັ້ນຂອງນໍ້າໜັກຜົນປະໂຫຍດ 6 ມິຕິ, ດັດຊະນີຜົນປະໂຫຍດດ້ານສຸຂະພາບ, ແລະ ເຄື່ອງມືຄົ້ນຄວ້າ ແລະການປິ່ນປົວມະເຮັງສະເພາະເອີຣົບ ຄຸນນະພາບແບບສອບຖາມ Core 30 tool.
ເວລາປະກາດ: 01-01-2024




