Ο ιδρυτής της Ola Bhavish Aggarwal επενδύει 230 εκατομμύρια δολάρια σε μια εκκίνηση του AI που ίδρυσε καθώς η χώρα πιέζει να εγκατασταθεί σε έναν τομέα που κυριαρχείται από αμερικανικές και κινεζικές επιχειρήσεις.

Ο Aggarwal χρηματοδοτεί την επένδυση στο Krutrim σε μεγάλο βαθμό μέσω του οικογενειακού γραφείου του, μια πηγή εξοικειωμένη με το θέμα δήλωσε στο TechCrunch. Σε μια ανάρτηση στην X Τρίτη, ο Aggarwal δήλωσε ότι ο Krutrim επιδιώκει να προσελκύσει επένδυση ύψους 1,15 δισ. Δολαρίων μέχρι το επόμενο έτος. Θα επιδιώξει να αυξήσει το υπόλοιπο της πρωτεύουσας από εξωτερικούς επενδυτές, ανέφερε η πηγή.

Η ανακοίνωση χρηματοδότησης συμπίπτει με την εκκίνηση του Unicorn Krutrim, κάνοντας τα μοντέλα της AI Open Source και αποκαλύπτουν σχέδια για την οικοδόμηση όσων ισχυρίζονται ότι θα είναι ο μεγαλύτερος υπερυπολογιστής της Ινδίας σε συνεργασία με την NVIDIA.

Το εργαστήριο κυκλοφόρησε το Krutrim-2, ένα μοντέλο γλώσσας παραμέτρων 12 δισεκατομμυρίων που έχει δείξει ισχυρή απόδοση στην επεξεργασία ινδικών γλωσσών. Στις δοκιμές ανάλυσης συναίσθημα, ο Krutrim μοιράστηκε την Τρίτη, σημείωσε 0,95 σε σύγκριση με 0,70 για ανταγωνιστικά μοντέλα, ενώ επιτυγχάνοντας ποσοστό επιτυχίας 80% στις εργασίες δημιουργίας κώδικα.

Το εργαστήριο διαθέτει ανοικτή προέλευση αρκετά εξειδικευμένα μοντέλα, συμπεριλαμβανομένων συστημάτων επεξεργασίας εικόνων, μετάφρασης ομιλίας και αναζήτησης κειμένου, όλα βελτιστοποιημένα για ινδικές γλώσσες.

“Δεν είμαστε πουθενά κοντά σε παγκόσμια δείκτη αναφοράς, αλλά έχουν σημειώσει καλή πρόοδο σε ένα χρόνο”, έγραψε ο Aggarwal, των οποίων οι άλλες επιχειρήσεις έχουν υποστηριχθεί από την Softbank, στο X. Για να δημιουργήσετε ένα ινδικό οικοσύστημα AI παγκόσμιας κλάσης. “

Η πρωτοβουλία έρχεται καθώς η Ινδία επιδιώκει να εδραιωθεί σε ένα τοπίο τεχνητής νοημοσύνης που κυριαρχείται από αμερικανικές και κινεζικές εταιρείες. Η πρόσφατη απελευθέρωση του μοντέλου “συλλογισμού” του Deepseek, που βασίστηκε σε ένα υποτιθέμενο μέτριο προϋπολογισμό, έστειλε κύματα σοκ μέσω της βιομηχανίας τεχνολογίας.

Η Ινδία την περασμένη εβδομάδα επαίνεσε την πρόοδο του Deepseek και δήλωσε ότι η χώρα θα φιλοξενήσει τα μεγάλα γλωσσικά μοντέλα του κινεζικού εργαστηρίου AI σε εγχώριους διακομιστές. Το Cloud Arm του Krutrim άρχισε να προσφέρει Deepseek σε ινδούς διακομιστές την περασμένη εβδομάδα.

Η Krutrim έχει επίσης αναπτύξει το δικό του πλαίσιο αξιολόγησης, Bharatbench, για να αξιολογήσει την επάρκεια των μοντέλων AI στις ινδικές γλώσσες, αντιμετωπίζοντας ένα κενό σε υπάρχοντα σημεία αναφοράς που επικεντρώνονται κυρίως στα αγγλικά και τα κινέζικα.

Η τεχνική προσέγγιση του εργαστηρίου περιλαμβάνει τη χρήση ενός παραθύρου περιβάλλοντος 128.000 token, επιτρέποντας στα συστήματά του να χειρίζονται μακρύτερα κείμενα και πιο πολύπλοκες συνομιλίες. Οι μετρήσεις απόδοσης που δημοσιεύθηκαν από την εκκίνηση έδειξαν ότι το Krutrim-2 επιτυγχάνοντας υψηλές βαθμολογίες στη διόρθωση γραμματικής (0,98) και στις συνομιλίες πολλαπλών στροφών (0,91).

Η επένδυση ακολουθεί την κυκλοφορία του Krutrim-1 του Ιανουαρίου, ενός συστήματος παραμέτρων 7 δισεκατομμυρίων που χρησίμευσε ως πρώτο μεγάλο γλωσσικό μοντέλο της Ινδίας. Η ανάπτυξη του υπερυπολογιστή με την NVIDIA έχει προγραμματιστεί να κυκλοφορήσει τον Μάρτιο, με την επέκταση να προγραμματίζεται καθ ‘όλη τη διάρκεια του έτους.