Decartography
仕組みの話について:
ソーシャルグラフ構築の話も、分散型オラクルの仕組みもおもろい
ただ、その二つをくっつけるのには若干疑問を感じた
というかこれは分散型オラクルではないのか
わかりやすくソーシャルグラフとしているが、どんなものを提供するのがいいのかわからない

Q. タグ付けの手段として、人力は最適?
感想として、まあなんかちゃんと仕組み作ればそれなりにうまく行く気はするが、エレガントではないなと思ってしまった

「タグ付けの手段が人力」っていうのは、ソーシャルグラフを作ることだけでみた時だと思う

あくまでもラベル付け ≒ データの圧縮がしたいなら、もう少し機械的にする方法もありそうな気がした
記述ということ?
記述方法を自然言語にして、ベクトルで測るみたいなこと?(実際pol.isは同じ言語上でしか動かなかったりしたはず)
あーでも自然言語で書かれたやつに対して、人が投票するんだっけな

↑「記述」で指しているものがよくわからない

ここで言いたかった違和感は、すぐ下の「思った課題」でより具体的にかけた気がするのでそっち参照

「人に自然言語のタグを選ばせる」作業がとても言語に依存しているから、情報が削減されたり恣意性が生まれたりしてよくないよな〜みたいな気持ち
思った課題
人力タグ選択の課題の一つとして、人間が言葉(=タグ)として解釈できる粒度まで情報量が落とされてしまう問題がありそう
「Public Goods」のタグをつけてもらう場合、その中の違いは全部削ぎ落とされてしまう
むずいよな、どうするのがいいんやろ

そもそも
クラスタリングというのは情報量を落とす行為だから、ここでは人間の言葉に依存するというのが良くないということだよね

そう、言語のラベル付けに依存しない方法ならクラスタリングせずにすむ手段もありそう
あと、選択肢のタグの設定が恣意的な問題もありそう
例えば特定のタグを選択肢から排除することで、DeCartographyでそこのpluralityを判定できないようにするみたいな不正が容易にできる
>クラスタリング(英: clustering)、クラスタ解析(クラスタかいせき)、クラスター分析(クラスターぶんせき)は、データ解析手法(特に多変量解析手法)の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。
目的はアドレス間の多様性の評価なので、そもそもクラスタリングをする必要はなさそう

それはそう

それでいうと、アドレスはクラスタリングされるという暗黙の前提に基づいてるのは危険かもしれない

他の手段として思いついたもの
例えば、「二つのアドレスはどの程度似ているか」みたいな質問に群衆に答えてもらって、それを高次元空間にプロットして距離判定、みたいな手段もある気がする?
この場合、言葉の粒度まで情報量が落とされてしまう問題が解決できる
あと、用意するタグの恣意性が入り込まないのでより良い
なるほどねぇ、それはあるかも。何回も繰り返せばいわゆる2次元以上の空間にできるイメージ?

「二つのアドレスはどの程度似ているか」というのはやはり人間の恣意的な部分が入ってくるから、完全に機械だけで判定するべきかなぁと思った

なんかまぁ別という感じか、オラクルに関してはどっちなんだろう。
ようはこれって、人間の言葉で表せられるベクトル空間にマッピングしているということになりそう?

機械で目的を達成できるならそれで良いと思うが、「投票における"良い"多様性」を判定するには人間世界の情報がないとできないような気がした(直感)


なので人間あるいは自然言語モデルとかを使う手段になる?
人間の自然言語モデルを使うのめっちゃ良いな

ただ自然言語モデルはそれこそモデルの選択が恣意的なので、それよりは群衆を使う方が良い気はする?

「二つのアドレスはどの程度似ているか」という質問をするよりも、群衆が作った自然言語モデルを使った方が恣意的な部分は減りそうな気がした(直観)

ここの論点一般化して「恣意性を排除した自然言語モデルの作り方」、分散システムの方法論(詳しくは知らん)が応用出来そうでおもろそう
+100

あと「投票における"良い"多様性」とは?をもっと追求したい

本当にそれは良いのか?

Q. そもそもタグ付け情報は何に使う?
「タグが異なる2人の投票の方が、タグが同じ2人の投票より価値ある」とする、ということかな
じゃあソーシャルグラフとは関係ない話?
①ソーシャルグラフによる社会的距離情報 + ②タグ付け情報 で、アドレスの多様性を判定するみたいな感じかな?
もっと思想的な部分について:

の理解:
それを根拠に、「タグが異なったりソーシャルグラフで遠い2人の投票が、近い2人の投票より重要」という主張をしている
まあなんかそう言われればそうかも?という気持ち
ただ
自分は追えていないが、vitalik周辺の人々が色々議論していてstableな土台があるんだろうなと予想
この主張/思想の土台、referenceがあるなら知りたい

「多様が良いという思想は前提なので、その前提に関しての疑問はそっちを参照してね」というやつ
例えばvitalik(誰でも良いけど)がこの主張の根拠を長文でかいてたりするなら、それがreferされてると良いなと思った

クリプトのここ二、三に関しては
NFTサマー(2020)
DeFiサマー(2021)がきた後に若干落ち込んでる
今まで
DAOとか作られてきたけど、思想面が全く非中央集権になってなかった(組織構造とかも含めて)
そこで、プロジェクトトークンがエクイティ(をただ、トークンにしたもの)みたいなところがあって、「これは単なる証券化では」みたいなのもあった
そこで、どんどん多様化してきて、やっと「もっと人間的にちゃんとしてるっぽいやつの方が良くね?みたいな
戻ってきた感
2. 「多様な投票の方が良い」という前提が真だとして、「タグが異なったりソーシャルグラフで遠い2人」が、良いとされている「多様性」であるという繋がりの説明や前提が知りたい
何となくそんな気はするが、とても曖昧な主張に感じる
全然ない、やってみないとわからん。だからもっといろんな人からつっこまれたい

やってみてどうだったら、それが良いと言えるのかが知りたい

(評価方法が定まってないなら実験をする意味がないので)
あ、Decartographyの目的は
シビル攻撃の防止だった?

いや、そこからだとユースケースが強そうかなという感じ。実際にGitcoinのチームも興味持ってもらってるなら、すぐに検証できるところでやれた方がいいかなと

シビル攻撃①談合防止の用途と、②多様な投票を良いとしたい用途は多分別の話だと思うので、後者の評価方法もあるなら知りたい

例えば、つながりのない2人が同じ投票をしたとして、
①談合防止の目的の場合: 別に良い
②多様な投票良いとする場合: 同じメディア見たNPCだろうから重み付け下げたい
という理解

そうだよね〜それは分かるんだけど、まぁなんか疑問とかわからんことあるけどやってみないとわからんくね?というのが一貫した感想かな。むしろどうしたらいいと思ったりしてるのかを知りたい

「やってみないとわからん」は同意、ただやってみて結果が出た後に(特に②の論点に関して)それをどう評価するのかが気になった

(例えば学会でAIモデルの研究を発表するなら、モデルを評価するところも含めて論文に書く)
crpytoの世界だと、結果をフォーラムとかに公開して評価は他の人に任せる、みたいな方法論だったりする?

いや〜まぁそれはそんなことないんじゃないかなw

別に評価をしてもしなくてもいいし..
ふむ、あるオラクルのデータソースとしてはまず検証してもらって、それをGitcoinがいい感じに使えるんじゃね?みたいな感じだな今

まぁそれでいうと、仮説持っていってフォーラムに投げた方がいいのはそらそうか
流れ
2. ホワイトペーパーというかリリースしてにこんな方法でこんなの作ったよ
3. フォーラムに投稿する
4. データ使ってもらう
ぐらいしかわからんわw

そこからはコミュニティが評価する(あるいは残念な場合は放置される)みたいな感じか

そこを詳しく知りたい/言語化して欲しい気持ち


なぜ期待値を高いと思うのか
オラクルは出せば儲かるんじゃね?みたいな雰囲気は感じるw

そこが根拠だと思うので
ただ、何を評価するために実験するのかのイメージはあった方が、最適な行動が取れる気はする

例えば、「ソーシャルグラフとタグ付けに思想の多様性は表れるのか」みたいなResearch Question
このあたり、アカデミア的方法論とcryptoの方法論(主語でかいかも)の違いがあっておもろそう

シビル攻撃ではない、
談合の防止

例えば反例を書くなら、
99%の人はAと考えるが、1%の人はBと考える、みたいな状態があったとして、Bはタグ付けに反映される?
minorityのものを一番反映させたいのだと思うが、それをタグ候補として提示するの、むずくね
(これは反例というより仕組みの欠点の指摘だな、論点が違った

)
なので、それらのジャッジがどう動いてるかを透明性持てれば、Gitcoin側にそれは交渉できるようにすればいいんじゃないかな、知らんけど
自分はCryptoの世界の知識ないので、良い反例を指摘するのむずいな

というかまあ反例は実験しないと指摘できないので、どちらかというと論点の提示をすべきか
Q. ソーシャルグラフとタグ付けに思想の多様性は表れるのか
が、これはいろんなエコシステムがどんどんウォレットに対して
POAPや
SBTなどをdropするので、それらを共有しながら幅広い人たちのタグ付けを取り入れることが可能
(Twitterでいう)いわゆる「ある程度のフォロワーとかツイート内容がないとBotとみなされる」
Q. ソーシャルグラフ/タグ付けに恣意性は入りこまないのか
など
ここの論理的つながり/反例への強度がしっかりしていた方がDeCartographyの仕組みに納得出来そう
そもそも論として、DeCartographyは資金の分配をするときのQFの変数を求めたいという話だった記憶があって、とあるプロジェクト関係者からだけの投票だと意味が無い

つまり「投票における"良い"多様性」は投票によって異なるんだろうな

DeCartographyの場合は、投票者が関係してるプロジェクトが多様であることが良い

>@kanair_jp: この話、人が恣意的に選んだものよりも、アルゴリズムに選ばれたものの方がフェアだという認識がすでにできつつあることが面白い。信頼されるAI技術をどう作るかというのはよく話題になるが、実はAIの方が信頼される世の中になるのではないか。