Biểu trưng OpenStreetMap OpenStreetMap

Ideas for a "suspect changesets classifier"

Do naoliv đăng vào 17 tháng 05 năm 2014 bằng English.

Sometimes we find here in Brazil some imported data from +4 months ago, that nobody saw until now. Usually, these imports are followed by some other changesets deleting the old data + changesets modifying/adjusting the imported data.

We also see some changesets where people purposely/unconsciously delete a lot of data.

Could a Bayesian filter, SVM or something else be used to classify a suspect changeset? Could we use something smart for this task?

Biểu tượng thư điện tử Biểu tượng Bluesky Biểu tượng Facebook Biểu tượng LinkedIn Biểu tượng Mastodon Biểu tượng Telegram Biểu tượng X

Thảo luận

Bình luận của cartinus vào 18 tháng 5 năm 2014 lúc 01:42

When using WhoDidIt you can see which changesets contain lots of deletions.

Bình luận của naoliv vào 18 tháng 5 năm 2014 lúc 02:18

The problem is that I can’t manually verify every changeset (and that’s why I am wanting some kind of classifier).

Bình luận của Nakaner vào 18 tháng 5 năm 2014 lúc 13:04

The German user Oli-Wan (a very active German forum member) developes a tool to detect vandalisms and other bad changesets. He has written about his idea/work in German forum. You may contact him in e.g. in German or English.

Bình luận của cartinus vào 18 tháng 5 năm 2014 lúc 19:02

That is why I mentioned WhoDidIt. Changesets with lots of deletions are specially marked. So you won’t have to check them all.

Đăng nhập để nhận xét