social.tchncs.de is one of the many independent Mastodon servers you can use to participate in the fediverse.
A friendly server from Germany – which tends to attract techy people, but welcomes everybody. This is one of the oldest Mastodon instances.

Administered by:

Server stats:

3.8K
active users

#computervision

7 posts7 participants0 posts today

If you would like to experiment with #ComputerVision, but don't feel like putting an entire PC with a beefy graphics card onto your #robot, there is a great project out there that has been alive for a decade. It's called OpenMV (openmv.io) and it's a microcontroller board with a built-in camera, running #MicroPython, with a whole lot of vision algorithms built-in. I have several project ongoing using early versions of it, but now they have a Kickstarter for two new models.

OpenMVSmall - Affordable - ExpandableThe OpenMV project is about creating low-cost, extensible, Python powered, machine vision modules and aims at becoming the “Arduino of Machine Vision“.

Our #image #analysis #pipeline is ready to go into #pruduction.

It combines #AI and #forensic techniques to assess authenticity. It first extracts EXIF/XMP #metadata to detect real camera data forcing a “photograph” classification if present. Then, a CLIP based preprocessor (#computervision) classifies images into categories: photograph, meme, infographic, comic/cartoons, or text only.

Custom configurations (#development) adjust weights so that, for example, memes/text only images discount AI model influence while forensic tests (ELA, FFT, noise, edge sharpness, text detection) (#science, #math) quantify artifacts. #C2PA data is also considered. All evidence is combined to yield a final decision which will be the “confidence percentage” data that will be included in every post moving forward.

#ThankYou to everyone who cast a #vote

#tech 🚀 #mastodon 🐘 #community 🤝

#image, #memes, #photos

✍ 📰 𝗨𝗻𝘀𝗲𝗿 𝗝𝗼𝘂𝗿𝗻𝗮𝗹𝗶𝘀𝘁-𝗶𝗻-𝗥𝗲𝘀𝗶𝗱𝗲𝗻𝗰𝗲-𝗣𝗿𝗼𝗴𝗿𝗮𝗺𝗺 𝗴𝗲𝗵𝘁 𝗶𝗻 𝗱𝗶𝗲 𝗻ä𝗰𝗵𝘀𝘁𝗲 𝗥𝘂𝗻𝗱𝗲

👩‍💻 Das Programm bietet Journalist:innen die Möglichkeit, in einem drei- bis sechsmonatigen, bezahlten Aufenthalt in Tübingen zu einem selbst gewählten Thema zu recherchieren.

🤖 Von uns gibt es Einführungen in Themen wie #MachineLearning, #ComputerVision und #Robotik

📧 Bitte bewerben Sie sich mit kurzem Ideenpapier, Anschreiben&Lebenslauf (DE o. ENG) 𝗯𝗶𝘀 𝟮𝟰.𝟬𝟰.𝟮𝟬𝟮𝟱
Bewerbungen bitte per E-Mail an janis.fischer@cyber-valley.de

Я тут немного гонял Gemma 3.

В @ollama с ней сейчас некоторые проблемы с памятью поэтому 27B версию нормально трогать не получается.

Ну, когда есть версия 27B как-то не очень хочется гонять 12B версию и поэтому я её почти не трогал и ждал когда починят менеджмент памяти.

Но тут я случайно вспомнил что Gemma 3 - мультимодалка. И решил попробовать посмотреть что там как с пониманием картинок.

До этого я уже баловался со всякими LLaVA, которая мне откровенно не понравилась, а также с LLaMA 3.2, которая была заметно лучше, но всё равно была не очень надежной.

А вот Gemma 3 меня прямо удивила.
Она мне тут и кошку в темноте нашла, и моток филамента объяснила даже уточнив, что тот лежит на коврике для мыши хотя этого коврика там лишь кусок в углу фото.

А тут она мне ещё и состав моей стойки расписала вплоть до того, что угадала аудио-интерфейс, что в него включён микрофон (его нет на фото) и что это домашняя студия.

Сильнее она удивила бы меня разве что если бы посчитала по торчащему в розетке ваттметру потребление и сделала вывод, что на сервере с фото она и работает, лол.

Короче, я впечатлён. Google молодцы.

#pic#log#LLM
Replied in thread

*edited to add: sorry I see it as base 1 now!

@kvistgaard @tanishqkumar

Gosh thank you for telling me about this. If I understand correctly, it's base-0? Are there any articles for lay-readers on it? I regret those I found either explained it as something I'd interpret as base-0, and I found hard to understand how to create and compute abstractions from that foundation, or they seemed aimed at readers who were already thinking in terms of computing with those abstractions, and I was a bit lost!

My applications for fast computing would be things like Wide Area Motion Imaging or gimbaled sensors that have to make tiny movements with superb accuracy and speed in order to see things very very far away.