ଜାତୀୟ

AI Catbots: AI ଚାଟ୍‌ବଟ୍‌ସକୁ ଅନ୍ଧ ଭଳି ବିଶ୍ୱାସ କରିବା ହୋଇପାରେ ବିପଦ!

ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍‌ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍‌ର ନୂତନ ଫ୍ୟାକ୍ସ୍‌ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି।

ନୂଆଦିଲ୍ଲୀ:ଗୁଗୁଲ୍ ଏବେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ରିପୋର୍ଟ ପ୍ରକାଶ କରିଛି, ଯେଉଁଥିରେ ଏଆଇ ଚାଟବଟ୍ସର ସଠିକତା ବିଷୟରେ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ରିପୋର୍ଟ ପ୍ରକାଶ କରାଯାଇଛି। ଗୁଗୁଲ୍‌ର ନୂତନ ଫ୍ୟାକ୍ସ୍‌ ବେଞ୍ଚମାର୍କ ସୁଟ୍ ମାଧ୍ୟମରେ ଏହା ସାମ୍ନାକୁ ଆସିଛି ଯେ, ବିଶ୍ୱର ସବୁଠାରୁ ଶକ୍ତିଶାଳୀ ଏଆଇ ମଡେଲ୍‌ଗୁଡ଼ିକ ମଧ୍ୟ ତଥ୍ୟର ଦୃଷ୍ଟିରୁ ସମ୍ପୂର୍ଣ୍ଣ ନିର୍ଭରଯୋଗ୍ୟ ନୁହେଁ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, କୌଣସି ବଡ଼ ଏଆଇ ମଡେଲର ତଥ୍ୟଗତ ୭୦ ପ୍ରତିଶତରୁ ଅଧିକ ନୁହେଁ। ସରଳ ଶବ୍ଦରେ, ଏଆଇ ଚାଟବଟ୍‌ଗୁଡ଼ିକ ପ୍ରତି ତିନୋଟି ଉତ୍ତର ମଧ୍ୟରୁ ଗୋଟିଏକୁ ଭୁଲ‌୍ ଦେଉଛନ୍ତି।

ଗୁଗୁଲ୍ ଜେମିନି ୩ ପ୍ରୋ ସବୁଠାରୁ ଠିକ୍ ଥିଲା

ଗୁଗୁଲର ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷଣରେ, କମ୍ପାନିର ଜେମିନି ୩ ପ୍ରୋ ମଡେଲ ଶୀର୍ଷରେ ଆସିଥିଲା। ଏହି ମଡେଲ ୬୯ ପ୍ରତିଶତ ତଥ୍ୟଗତ ସଠିକତା ହାସଲ କରିଥିଲା, ଯାହା ସମସ୍ତ ପ୍ରତିଯୋଗୀ AI ସିଷ୍ଟମକୁ ପଛରେ ପକାଇ ଦେଇଥିଲା। OpenAI , Anthropic, ଏବଂ ଏଲନ୍‌ ମସ୍କଙ୍କ କମ୍ପାନୀ xAI ର ମଡେଲଗୁଡ଼ିକ ଏହି ସ୍ତରକୁ ପହଞ୍ଚିପାରି ନଥିଲେ। ରିପୋର୍ଟ ଅନୁଯାୟୀ, ଜେମିନି ୨.୫ ପ୍ରୋ ଏବଂ ଚାଟଜିପିଟି୫, ୬୨ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। କ୍ଲାଉଡ ୪.୫ ଓପସ୍ ୫୧ ପ୍ରତିଶତ ସଠିକତା ହାସଲ କରିଛି। ଏବଂ ଗ୍ରୋକ୍ ୪ ପ୍ରାୟ ୫୪ ପ୍ରତିଶତ ହାସଲ କରିଛି।

ଗୁଗୁଲର FACTS ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା କ’ଣ?

ଗୁଗୁଲର ଏହି ବେଞ୍ଚମାର୍କ ପରୀକ୍ଷା ପାରମ୍ପରିକ ପଦ୍ଧତିଠାରୁ ଭିନ୍ନ ଭାବରେ AI ମଡେଲଗୁଡ଼ିକର କ୍ଷମତା ପରୀକ୍ଷା କରେ। ସାଧାରଣତଃ AI ପରୀକ୍ଷାରେ ମଡେଲକୁ ପାଠ୍ୟ ସାରାଂଶ ତିଆରି କରିବା, ପ୍ରଶ୍ନର ଉତ୍ତର ଦେବା କିମ୍ବା କୋଡ୍ ଲେଖାଯାଇଥାଏ।

ଏଆଇ ମଡେଲଗୁଡ଼ିକ ଚାରୋଟି ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ପରୀକ୍ଷା ଦେଇ ଗତି କରନ୍ତି

* ପ୍ରଥମ ପରୀକ୍ଷଣରେ ଦେଖାଯାଏ ଯେ AI ମଡେଲ୍ କେବଳ ଏହାର ତାଲିମ ତଥ୍ୟ ଉପରେ ଆଧାର କରି ତଥ୍ୟଗତ ଉତ୍ତର ଦେଇପାରିବ କି ନାହିଁ।
* ଦ୍ୱିତୀୟ ପରୀକ୍ଷା ମଡେଲର ସନ୍ଧାନ କାର୍ଯ୍ୟଦକ୍ଷତାର ମୂଲ୍ୟାଙ୍କନ କରେ।
* ତୃତୀୟ ପରୀକ୍ଷା ଯାଞ୍ଚ କରେ ଯେ ନୂତନ କିମ୍ବା ଅତିରିକ୍ତ ତଥ୍ୟ ପ୍ରଚଳନ ସମୟରେ ମଡେଲଟି ଡକ୍ୟୁମେଣ୍ଟ ସହିତ କେତେ ଭଲ ଭାବରେ ଖାପ ଖାଏ।
* ଚତୁର୍ଥ ଏବଂ ଅନ୍ତିମ ପରୀକ୍ଷା ମଡେଲର ଚାର୍ଟ, ଡାଇଗ୍ରାମ ଏବଂ ପ୍ରତିଛବି ଭଳି ବହୁମୁଖୀ ବୁଝାମଣା ବୁଝିବାର କ୍ଷମତାର ମୂଲ୍ୟାଙ୍କନ କରେ।

ଉପଭୋକ୍ତାମାନଙ୍କ ପାଇଁ  ଶିକ୍ଷା

ଏହି ଗୁଗୁଲ୍ ରିପୋର୍ଟ ସ୍ପଷ୍ଟ ଭାବରେ ସୂଚାଇ ଦେଉଛି ଯେ ଏଆଇ ଚାଟବଟ୍ସ୍‌ଗୁଡ଼ିକୁ ଚୁଡ଼ାନ୍ତ ଭାବରେ ଗ୍ରହଣ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ। ଏଆଇ ପ୍ରତିକ୍ରିୟାଗୁଡ଼ିକର କ୍ରସ-ଚେକିଂ ଅତ୍ୟନ୍ତ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ବିଶେଷକରି ଯେତେବେଳେ ଏହା ଖବର, ଡାକ୍ତରୀ ସୂଚନା କିମ୍ବା ସମ୍ବେଦନଶୀଳ ନିଷ୍ପତ୍ତି ବିଷୟରେ ଆସେ ଠିକ୍‌ ଭାବେ ପରିଖିନେବା ଜରୁରୀ।

ସୌଜନ୍ୟ ସମ୍ବାଦ

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button