蓉's profile一如年少PhotosBlogLists Tools Help

Blog


    10/28/2008

    Sadomasochism(SM 之数据版)

    “折磨数据”(torturing data)还是“被数据折磨”(being tortured by data),这是一个问题。

                                                                                                                       -----某经济学家

    最近实在是太痛苦,且讨论痛苦的原因本身会又一次让我限于痛苦之中:我的数据。美国的劳动数据统计网站打开无数次又关上无数次,最后黔驴技穷,连Goole都用上了,搜索“Data,XXX”。刚想哭天抢地一番,宣称自己大概是第一个找数据找到如此绝望的人,Yuanyuan在MSN上来一句,“能帮我现查一下N=499,alpha=0.025的t分布的Critical Value么?”赶紧停止抱怨,埋头继续。。。我的一个名叫做“泰勒”的教授有三大定理,第二个就是说,任何一个以“我是不是唯一一个。。。”开头的问句的回答都是“否”。(第一定律是:任何一个以“历史上有没有关于XXX的研究?”为基本句型的问句的回答都是“是”。。。第三定律我忘记了。。。)于是,我决定在这个痛苦的关头,写这样一篇博客,表达一下广大“被折磨”者的心声。

    data

    首先要明确的是,所有象我现在这样被数据折磨着的人们,有绝大多数是自愿被折磨的。泰勒第一定律换一种说法就是,任何可以做的研究都已经被研究过了。由此就可以引申,任何可以轻而易举找到的数据早已经被找到且分析过了。我们所要找的,一者是零散而不健全的数据,二者是需要数轮推演绞尽脑汁才能变换出的数据,三者就是根本不存在的数据。更大的问题是,当你开始找数据的时候,你不知道你要找的这个东西会落入如上三类的哪一类里,零散者只要下苦功还是可以拼凑成齐全,复杂者只要动脑筋还是可以演算出结果,但是怕就怕,或苦功不够,或脑筋不灵,外加数据根本不存在

    其次,不要以为“数据不存在”是显而易见可以得到的结论的。数据是有结构的,一个失业率可以分州统计,分年度统计,按工业编码统计,按职业编码统计,更可以按工业编码且职业编码统计,按工业编码且职业编码分州统计,最佳的数据是“年度齐全的按工业编码且职业编码分州统计的失业率”。。。总之,最好的数据是一定存在在这个世界上的,然后才会有了那些加总过后的一个维度,或者两个维度的统计表格,可惜不是什么时候,这些数据都会以它最原始,最干净的样子出现在你的电脑屏幕上的。。。数据的可恨之处就在于,有时候它会给我们一线希望,然后慢慢地让我们绝望至极。。。

    最后的抱怨是对那些提供数据的网站。举我下载美国各州Licensing occupation的例子,下全了50个州,鼠标手都要有了。。。每一个州都有数十个大类,但是可惜我要的是小类的信息,于是要一下一下点开那些大类前面的加号(+),然后再选中这些大类兼小类的信息,然后Control C到记事本(因为网页是以表格形式存储这些数据的),然后再次全选,再次Control C,然后Control V到Word文档,点另存为,以各州的名字编写新的文件名,然后回到网页,后退到选择“州”的那一页,然后重复如上流程50次整。。。再次说,我知道你有这些数据,我也知道你能有这些数据,很不容易,但是大家都是一路的,何必要变自己的Masochism为对他人的Sadoism呢?。。。

    pd_sadomasochism_080213_mn

    看完了我们是如何被数据折磨的,就不难知道,一旦弄到了这些数据,我们会怎么对它。。。“Torture until confess...”曼昆的博客最近也在坦白忏悔,他也曾“Engaging in data mining”。可是,被数据折磨到现在的我是感同身受的,如果第一轮分析没有结果,我下面该怎么做呢?放过它?丢进历史的垃圾堆然后承认之前我所受的折磨一钱不值?怎么可以!!!我比较,我验证,我筛选,我Fixed Effect,Random Effect,Robust standard error。。。直到显著性水平上升到95%,我才罢手。。。由masochism精神引领的我被数据折磨了这么久这么久,现在终于脱胎换骨成了Sadoism精神新一代的领袖。。。这个世界就是这样不断循环的。Enrick Fromm在爱的艺术中说,受虐倾向和施虐倾向其实是同一渊源的。我深表赞同。

    不知道你现在处在什么阶段,论你的论文进程,或者祝你“受虐”快乐,或者祝你“施虐”快乐~

    10/25/2008

    佐证

    "与东欧同事谈到家庭婚姻的状况,有些现象让人瞠目结舌:匈牙利从18岁到50岁人口中,只有极小一个比例的人是结婚的,其余为单身人(比例最大),同居者人群,和LAT(分开居住的固定伴侣)人群。在所有新生儿中,非婚生的比例大大超过婚生的。会见社会学所所长时,他说有一次他来中国,在中国人民大学和学生聊天,他们都说不会选择同居,而是会选择结婚,他不知这些人跟他说的是不是实话。我告诉他,我相信这是中国青年的真实想法,虽然婚前性行为有上升趋势,但是最终还是会选择结婚,这点跟匈牙利青年们的选择可是大大的不同。我能理解他为什么会怀疑中国人没跟他说实话,因为匈牙利的青年要是这么回答就肯定没说实话。在中国,我们一点也没有感觉到婚姻形式的危机,好像一切还都是天经地义别无选择的。了解一下其他社会中巨大的文化差异,对自己的文化会有更清醒的认识和定位。"

    http://blog.sina.com.cn/s/blog_473d53360100b7vs.html

     

    列出李银河博客上的这一段,只是为了说明,如果你觉得我是这个世界上唯一这样想的,匈牙利人和我的想法差不多。。。:)

    10/21/2008

    悲观的婚姻

    在此之前,我还是向往婚姻的。因为从小到大看到成功的夫妻比例远大于不成功的,虽然很可能我所谓的“成功”的那一部分里还包括了人前成功,人后失败的例子,可我还是愿意相信他们,相信如果吵架了之后试图包容彼此,他们还不至于落入“不成功”的那个类别里。我想,也许人和人相爱,然后自然就希望朝夕相处,然后就应该结婚生子,白头到老。所以,大概我也不能例外。

    爱一个人就是希望更多的相处,更好的照顾,更长久的对话或者即使默默相望。然而,前面的这一些又有哪一样和婚姻非要有必然的牵连呢?父母兄弟之爱,知己友伴之情,我亦希望更多的相处,更好的照顾,禺禺私语到天明,然而,我却并不要 与他们结婚才可以做到这些,那么婚姻的真实意义又是怎样的呢?

                                                                       marriage-symbol

    也许,人们是因为要生子而结婚的,因为法律说,私生子是不好的。可是如果法律归法律,当人真的想和另外一个人生产出一个孩子,并且信誓旦旦地觉得他(或者她)能养好这个孩子,那么法律也许就不那么重要了。换句话说,如果法律说,现在禁止一切人结婚,所有的孩子都是“私生子”,我相信,我们的下一代还是会好好的成长的,与孩子有关的话题,应该都是与爱有关的话题,那么又回到上一段的结论了,撇开了爱的元素,又非要婚姻来搅和什么呢?

    也许,人们是因为约束而结婚的,因为法律说,如果你和一个人结婚,你就不能和另一个做同样的事情了。婚姻如此排他,是拒绝一切分享和交换的行为。再想想,觉得原来人类是如此无助的,一旦得到,就不能承受失去之痛。当对方想要自由,就只好拿出千年之前的契约出来说事儿,反悔可以,你死我活就是了。突然,这就让我想到很多“绝望的主妇”的故事,突然,好像我看到的不成功的婚姻的例子就多起来了。所谓婚姻,原来和爱已经没有关系了;所谓婚姻,原来是当爱死去之后,它才活过来起些作用的。

    也许,即使爱没死,婚姻也让人懒得“出轨”,因为“离开”婚姻想想就觉得麻烦。那么已经晓得了对方的懒惰的人,除了日渐变丑变老,日渐婆婆妈妈之外还能做什么呢?诗云:想念你的云鬓,想念你的青衣。是不是说,现在的你已经是提着菜篮子大声叫门的主妇婆娘了呢?由于你的懒惰,我的安全,美的事物就不复有美的必要了,这也是托婚姻的福。

    所以,如果我们相爱,就应该相守相处,拳拳地恋着彼此;

              如果我们相爱,应该有一天,我们就可以有一个孩子,然后用爱哺育它;

              如果我们相爱,自由应该是第一位的,爱没了,就让它走,这是不能强求的;

              如果我们相爱,我们当尊重彼此,把自己的美好尽可能地展现给对方,这样的“尽力”,这样的“展现”,也是尊重的一种形式;

             

    我突然以为,婚姻不是我曾想象的那件事情,它甚至跟我所追求着的生活是截然相反的。。。有关婚姻与爱的牵连,如果有什么,那就是负相关吧。。。

    说“悲观的婚姻”,我有什么错呢?

    10/9/2008

    所谓未来

    突然觉得,未来这个东西太虚无缥缈了。

    如此感叹,原因之一是美国的金融市场,前一天都还好好的,突然世界末日就来了,倒闭的倒闭,兼并的兼并,然后股市大跌,救市也跌,不救也跌,不知道究竟这个离散的市场决策中个人的行为都是以什么为指导的,还是说,其实大家都和我产生了一样的感叹,未来啊,太虚无飘渺了,股市啊,涨了又怎样呢?最终还不是跌?于是,道琼斯终于跌破了10,000点。中国的股市,欧洲的股市,发达国家,发展中国家一起在这个“钱”字的定义上晃荡,原来谁也闹不清自己积攒了奋斗了一辈子的东西究竟值多少,无论是房子,还是债券,还是股票,我们都是无知的动物,对未来无知,对命运无知。

    感叹的原因之二,来源是我自己。前一天还好好的,突然舌头就上火气泡,痛不欲生起来;然后牙龈和着起哄,逢刷牙必血淋淋,逢漱口必又酸又涨;然后嗓子在我深夜看了一出莎翁的大戏“哈姆雷特”之后开始作乱了,没有扁桃体的我却似乎能感受到扁桃体阴魂不散,吞咽费力;然后我感冒了,然后夜半咳嗽了好久,好不容易要睡着了,又咳,遂醒,上课,诺大的教室里就听到我在那里唏嘘唏嘘不已,下了课有善良的美国同学给我递药,不知道是该说Sorry,还是Thanks。今天期中考,公式加上感冒,大脑昏沉沉的。。。我不知道我是怎么了,上火,还是着凉?还是两个都有?我想尽快终结这个过程,作个中和反应,但是好像,这个不是我能做主的,遵外婆嘱咐,拼命喝水,拼命跑厕所,说,稀释一下病毒,似乎没有什么科学道理可说,但我又能怎样?

    最后的来源,是我的朋友们,不同于一年之前刚到美国的时候,女生们开始想家,大掉眼泪,男生们开始耐不住寂寞,说要工作,说挣饭吃的事;硕士开始毕业,博士开始考试,秋天的叶子黄起来,和去年刚开学的时候一样,可是我突然觉得生命的经历大大地不同,每一步都比后一步来的紧迫,来的惶恐。我现在要做的是赶紧找到我的研究方向,然后还不能放松警惕对大千话题的好奇,要广博的阅读,也要有专攻,要写Referee Report,也要做数据处理的苦功,我问Fountain,我们究竟能不能以学术作为娱乐,他却想到,手中无剑,心中也无剑。我们的联想功能都严重地被PhD思路左右了。。。一切都是未可知的,美国要不要我们不重要,重要的是我们要不要美国,而这一点大概是我们这些人,无论男人女人,无论博士硕士都在思考的问题,我们都觉得未来太虚无缥缈了,而即使明天,我们都还预见不了。。。

    和亲爱的Qr聊天,她说她是越来越爱MJ同学了;

    和亲爱的Roy聊天,他的MSN Icon是在交大的草坪上拍的,温和的草绿以及温和的眼神,我突然觉得,那是我理想中的Roy的样子,但是那是理想,现实中,我们都负担不起的理想。

    我也想再次拥有和Qr一样越来越爱的感觉,我也想拍一张和Roy的ICON上一模一样角度的照片,然而,我突然感觉到我和那个理想状态的我的距离之遥远。也就是这一年两年,我对自己说,我的世界却好像变了不是一年两年了。。。

    那么未来的一年两年,又会是怎样?

    。。。。。。