Başlangıç mantrası: Yapılandırılmamış verileri yapay zeka ile işleyin

hulya

New member
Binlerce sayfa, belge, web sitesi ve diğer kaynaklardan yapılandırılmamış verileri çıkarmak ve analiz etmek, dünya çapında bankalar, finans kurumları, sigorta şirketleri ve derecelendirme kuruluşları için zor bir görev haline geldi. Çoğu yapay zeka otomasyon şirketi, faturalar gibi basit ve standart formattaki belgeler için iyi çalışan, yapılandırılmamış verileri hızlı bir şekilde çıkarmaya yönelik çözümlere sahip olduklarını söylüyor. Ancak bu çözümler, yasal anlaşmalar, sözleşmeler veya şirket mali verileri gibi karmaşık belgelerden doğru verileri çıkarmakta başarısız oluyor.


nRoad’ın genişleme planları hakkında yorum yapan Hrishikesh Rajpathak (CTO), ABD’de hâlâ keşfedilmemiş büyük bir pazar olduğuna dikkat çekti. Rajpathak, yasal belgeler, sağlık ve ilaç gibi bitişik sektörlerin yanı sıra Avrupa ve Hindistan gibi diğer bölgelere de baktığımızı belirtti. (HT FOTOĞRAF)

Derin öğrenme teknolojisiyle desteklenen bir belge otomasyon platformu olan nRoad, belge yönetiminin geleneksel sınırlarını zorluyor. 2021 yılında Aashish Mehta (CEO), Hrishikesh Rajpathak (CTO) ve Prabodh Sunkara (COO) tarafından kurulan nRoad, Natural created kullanarak içgörüler ve nedensel analizler oluşturmak için yapay zeka modellerini finansal ve finansal olmayan belgelerden alınan büyük miktarda veri üzerinde eğitti. konuşma oluşturma (NLG) ve müşteri gereksinimlerine bağlı olarak özel çıktılar.

Facebook’ta HT Channel’daki son dakika haberleri ile güncel kalın. Şimdi Katıl

Başlangıçta…

Pune’da doğup büyüyen Rajpathak, BE Electronics eğitimini Sinhagad College of Engineering’den, yüksek lisans derecesini ise ISquareIT’den aldı. Daha sonra Kalıcı Sistemler’e geçti ve orada beş yıl çalıştı.

Rajpathak, “2011 yılına kadar Persistent’ta çalışırken birçok farklı teknoloji üzerinde çalıştım. Müşterinin yanında kısa bir süreliğine ABD’de bulundum ve ardından Persistent, L1 vizemi işleme koymaya başladı. Bu arada ben de kendi startup’ımı kurmakla ilgileniyordum ama o zamanlar Hindistan’da startup çılgınlığı yoktu.”

“Bir iş kurmak için çok fazla sermayeye ihtiyacınız olduğu ya da bir girişimci olarak başarılı olmak için girişimci bir aileden gelmeniz gerektiği fikri, bu kavramlar sarsılmaya başladı. Eşimle ABD’ye taşındığımızda rahat bir yaşam tarzına alışacağımızı ve her zaman girişimciliği hiç denememiş gibi hissedeceğimi tartıştım. Bana destek oldu ve ben de kendi işimi kurmak için işimden ayrıldım” dedi.

Erken yatırımcı

“İnsanlar genellikle tutkulu oldukları bir fikre sahip olduklarında işlerini bırakıyorlar. Rajpathak, “Bir ‘hata’ yaptım ve işimden ayrıldım çünkü bir şeyler yapmam gerekiyordu ama ne yapmam gerektiği konusunda net bir fikrim yoktu” diye anımsıyor. Şöyle dedi: “Ağ oluşturma etkinliklerinden biri sırasında, kendisi de doğal dil işleme alanında çalışan Mehta ile tanıştım ve ikimiz de bazı fikirleri tartıştık. Çok genel bir şey formüle etmeye başladık ve daha sonra ilk sosyal medya analiz ürünümü oluşturmaya karar verdik. İlk yatırımcım oldu.”

“Tek kişilik bir iş gibiydi. Nasıl satacağımı hiç bilmiyordum ama ürünü geliştirmeye devam ettim. İlk satış denememi yaptım ama pek başarılı olamadım. Mehta bu aşamada bana destek olmaya devam etti. Daha sonra ürünü nominal bir fiyata sattık ki bunu gerçekten ‘çıkış’ olarak adlandıramam” diyor Rajpathak.

İlk girişim

İlk girişimci “başarısızlığın” ardından Rajpathak, bir gıda derecelendirme uygulaması geliştirme fikrini ortaya attı. İşte o zaman yiyecek keşfi alanı başladı. Çeşitli uygulamalar kullanıcıların yemek yiyebilecekleri restoranları bulmalarına yardımcı oldu ancak bu restoranlardaki yiyecekleri derecelendirecek bir mekanizma yoktu. Mehta’nın yatırımcı ve Sahil Khan’ın kurucu ortağı olduğu Rajpathak, 2015 yılında Quinto.ai’yi kurdu. Rajpathak, birkaç kişinin bunun hakkında konuşmasını sağlamayı başardıkları için Quinto’nun başarılı olacağından emindi. Girişimci ikili ayrıca ilk resmi finansman turunu Faasos merkezli Jaydeep Barman’dan aldı.

“B2C çok zor bir oyun ve bunu fark ettik çünkü önemli ölçüde ölçeklendiremedik. Zamanla fonlar tükenmeye başladı ve bazı çalışanlar da şirketten ayrıldı. Quinto’da insanların kendi doğal dillerinde arama yapmasına ve soru sormasına olanak tanıyan bir teknoloji geliştirmiştik. Uygulama, tercihlerinizi bilen ve istediğiniz zaman sohbet edebileceğiniz sanal bir yemek tutkunu arkadaş gibi çalışır. O zamanlar birçok B2C ürünü sohbet tabanlı müşteri desteğine dönüştü. NLP teknolojisine sahip olduğumuzu fark ettik. Otomatik müşteri desteği arayan şirketler NLP teknolojimizle ilgilendiler ve biz de geçiş yapmaya karar verdik” diye açıkladı.

Quinto, bir yemek uygulamasından, şirketlerin sohbet yoluyla müşteri desteğini otomatikleştirmesine yardımcı olan bir B2B SaaS ürününe dönüştü. Quinto daha sonra Mumbai merkezli bir pazarlama teknolojisi şirketi olan Netcore Solutions tarafından satın alındı. Rajpathak, sonraki 2,5 yıl boyunca Netcore’da Baş Veri Bilimcisi olarak görev yaptı.

Yatırımcı kurucu ortak oldu

Bu arada Mehta’nın kendi şirketi RAGE Frameworks, 2017 yılında Genpact tarafından satın alındı. Mehta tarafından geliştirilen AI (NLP, NLU) tabanlı çözümler, en büyük banka ve finansal kuruluşların bazılarında bilanço dağıtımı, kredi verme ve varlık raporlama işlevlerini dönüştürdü. Genpact’ın yapay zeka çözümleri aracılığıyla bankalar, finansal hizmetler ve kurumlar genelinde dijital dönüşümü yönlendirmedeki rolünü sürdürdü. Rajpathak’a bir sonraki planlarını sorduğunda kilitlenme aşamasının sonundaydı. Mehta’nın otomatik belge işleme konsepti vardı ve sorunu ve pazarı iyi anlıyordu. İyi bir satıcıydı ve bu nedenle Rajpathak’tan kendisine katılmasını istedi. Mehta, meslektaşları Prabodh ve Rajpathak ile birlikte 2021’de nRoad’u kurdu.

nSokak

“Günümüzde pek çok veri yapılandırılmamış biçimde mevcut. Web sitelerinden belgelere kadar veriler, bir makine tarafından analiz edilebilecek şekilde tam olarak yapılandırılmamıştır. Sorun, bu yapılandırılmamış verileri nasıl kullandığımız ve ondan nasıl içgörü elde ettiğimizdir. nRoad bu tür yapılandırılmamış verileri işler ve bunlardan içgörü elde edebilir. İster ABD’de listelenen bir şirketin 500 sayfalık yıllık raporunu analiz ediyor, ister paragraflar, tablolar veya infografikler olsun, belirli veri noktalarını çıkarıyor olsun, nRoad verileri çıkarabilir,” diye açıklıyor Rajpathak.

“Risk analizi için milyarlarca dolarlık halka açık büyük şirketlerin analiz edilmesinden, bireysel krediler veya kredi kartı temerrütleriyle ilişkili risklerin anlaşılması için bireylerin banka hesap özetlerinin analiz edilmesine kadar, nRoad bankalara, finansal kurumlara, sigorta şirketlerine ve kredi derecelendirme kuruluşlarına, herhangi bir iş. dedi Rajpathak.

Derin öğrenme

Okuyucuların işini kolaylaştırmak için Rajpathak şöyle açıklıyor: “Belgeler tablolar, paragraflar, infografikler, grafikler ve diğer veri temsili biçimlerini içeriyor. Bu tür yapılandırılmamış verilerde öncelikle bir belgedeki farklı veri türlerini tanımlamamız gerekir. Veri türlerini belirledikten sonra bu verileri çıkarmak ve daha fazla analiz etmek için farklı stratejiler geliştirmemiz gerekiyor. Tablolardan veri çıkarma yöntemi paragraflarla aynı değildir. Bu amaçla çeşitli özel makine öğrenimi ve derin öğrenme teknikleri kullanıyoruz. Hem derin öğrenme hem de istatistiksel makine öğrenimi tarafında vizyon tabanlı ve NLP algoritmaları bulunmaktadır. Bu süreç, belirli veri temsili türlerine odaklanan birden fazla motorda gerçekleşiyor ve her şey bir belgenin tamamını çözecek şekilde bir araya getiriliyor.”

İlk katılım

Müşteri kabul sürecini anlatan Rajpathak, “Müşteri iletişimi kurulduktan sonra müşteri için çözebileceğimiz doğru türde sorun ifadesini anlamaya çalışıyoruz.” Ardından müşterilerle etkileşime geçmeye başlıyoruz. Bir veya daha fazla demo veriyoruz ve ardından belirli bir süre içinde sorular yanıtlanıyor. Kurumsal müşterilerin birden fazla karar vericisi olduğundan bu süreç zaman alır. Her iki taraf da nRoad’un çözebileceği bir sorun olduğuna ikna olduktan sonra ilerliyoruz. Gerçek müşteri verileriyle çalışabilmek için küçük (ücretsiz) veya büyük (ücretli) kavram kanıtını (POC) çalıştırıyoruz. Bu aynı zamanda motorlarımızın müşteri verileriyle çalışabildiğini ve sorunlarını çözebildiğini de gösteriyor.”

“POC başarılı olduktan sonra reklamlar, motorun maliyeti ve müşteri için gereken özelleştirmeler gibi diğer faktörlere göre tartışılacak. Satış sonrası, ürün ve teknik destek vb. diğer unsurlar için lisans ve özelleştirme ücretleri geçerlidir. Bazı müşteriler işleri geliştikçe ürünü de yükseltmeyi talep ediyor” dedi Rajpathak.

Genişleme planları

nRoad’ın genişleme planları hakkında yorum yapan Rajpathak, ABD’de hâlâ keşfedilmemiş büyük bir pazarın bulunduğuna dikkat çekti. Rajpathak, yasal belgeler, sağlık ve ilaç gibi bitişik sektörlerin yanı sıra Avrupa ve Hindistan gibi diğer bölgelere de baktığımızı belirtti.

“Yeni teknolojiler geliyor ve biz sürekli olarak bu yeni teknolojileri uygulamaya koymanın yollarını arıyoruz. Gelişmiş derin öğrenme tekniklerine ve büyük dil modeli (LLM) görme algoritmalarına sahibiz. Açık kaynak dil modelleriyle çalıştık ve bunları finansal belgelerde iyi çalışacak şekilde kendi veri kümelerimiz üzerinde eğittik. Amacımız teknolojimizi geliştirmeye devam etmek” dedi.