西西河

主题:用微分几何基础上的SVM, 研究肿瘤形状信息,提出预测 -- 晓兵

共:💬37 🌺42 新:
分页树展主题 · 全看 下页
  • 家园 用微分几何基础上的SVM, 研究肿瘤形状信息,提出预测

    好长时间没有到这里来了.主要是忙了一段下面介绍的几个项目.主要是我的医生儿子(他想做医生企业家, 现在纽约做内科实习医生, 他本科和医学院期间拿到资金创立运营过一些小公司),

    侄女 (Harvard PhD, Stanford post doc, bio-computing) , 我们三人在做.医疗领域做这些东西其实很困难, 中美都一样.现在想往其他领域走一走.在这里抛砖引玉. 请各位老朋友新朋友指点.

    1. quantmedical 第一主要产品.

    在微分流形基础上的统计回归分析模型, 可以提供比传统的人脸识别技术, 更好的分析和预测. 一个用途就是病人可以提供他的一些录像. 然后我们的模型利用大数据库进行机器学习. 提供初步诊断意见, 实现一定程度的远程医疗诊断

    quantmedical 模型主要技术: 保括将每一帧视频序列映射到微分流形上的一個點, 通过计算两个视频序列之间的"黎曼度量"意义上的"距离", 抱括两个序列各自的模型参数之间的"距离", 比较两个视频序列的相似程度.

    2. quantmedical 第二主要产品

    利用微分流形(格拉斯曼流形)进行肿瘤影像分析

    在3D恒定光照下的肿瘤影像是有三个角度参数的, 因此一个肿瘤在不同观察方向观察到的影像侧面都是一个独立的几何实体的一个方面, 这个独立的几何实体存在于一个三维流形(几何的黎曼几何世界里. 。微分流形首先是Hausdorff拓扑流形 . 流形作为一种拓扑空间,其局部与欧式空间相似: 流形上任一点存在开领域同胚于欧氏空间的某开集. 格拉斯曼流形上的肿瘤影像谱聚类: 给定一组点{x }并给出每对点的相似度比较,将所有点划分成群组,这样同一组中的点是相似 的,而不同组内的点不相似。。 格拉斯曼流形是R^n 的所有线性子空间的空间。可使用典型相关分析计算格拉斯曼流形上每对点的相似度, 所有点对的相似性得分.

    利用微分流形进行影像分析特别是视频人脸识别. 国外近年研究有些进展.

    文献 (Subbarao R,Meer Nonlinearmean shift over Riemannian manifolds InternationalJournal ComputerVision,2009,84(1):1 20. ) 使用一种外在方法将格拉斯曼流形上的点嵌入欧式空间进行均值偏移算法。进行聚类算法中的迭代时, 将流形上的每组点数据转换到其切空间,然后回到流形,该过程十分缓慢耗时.

    文献 (Turaga P,Veeraraghavan A,Srivastava A,et al. Statistical computations stiefelmanifolds videobasedrecogni tion PatternAnalysis MachineIntelligence,IEEE Transactions on,2011,33(11):2273 2286.) 提出了一种基于Karcher均值的半内在的迭代方法来计算流行上一组点的均值.

    在现代微分几何中,"曲面"抽象的看来是一个二维微分流形。将这个观点和曲面的经典理论联系起来的是将抽象曲面嵌入到R3中,并用第一基本形式赋予黎曼度量。假设这个嵌入在R3中的像是曲面S。局域等度就是R3中的开区域之间的微分同胚f: U → V,限制到S ∩ U就是到自己的像的等度变换。整个流形上求导的方向可以是任何切向量的方向。 这样得到的导数就称为协变导数,其微分称为协变微分. 流形上微分同胚.

    利用微分流形进行影像分析方兴未艾, 国外尽管开始研究已经多年.也是刚刚起步“quantmedical” 正在努力进一步改善相关算法, 以便更广泛地应用于医疗成像和分析领域.

    3. quantmedical 第三主要产品

    微分流形回归动态模拟手术方案, 为外科医生肿瘤手术提供决策支持

    假设病人有一个肿瘤, 微分流形回归动态模拟将根据相关的协变量信息(例如肿瘤位置, 大小和形状, 患者年龄和性别), 给出两类信息供外科医生参考: 1. 各类型的手术操作下,术后的肿瘤生长轨迹。2. 从对病人最有利的角度出发, 评估术后的肿瘤生长轨迹, 以及相关的手术方案.

    通宝推:华恩,
    • 家园 照妖镜:ML in your browser

      A Javascript library for training Deep Learning models (mainly Neural Networks) entirely in your browser: Andrej Karpathy, 史坦佛博士生,东欧文工团,本科计算机加物理; ML 以后也可以挂在你的谷歌眼镜上, 94机器学习照妖镜; 94要先整出来prototype, 你跟这边的老中 big 5讲,他们9翻白眼.

      Andrej Karpathy: "I'm working on quantizing and compressing the network in various ways so that it fits into a few tens of megabytes and still delivers state of the art image recognition performance, but in your browser."

      //Next Generation Machine Learning - Training Deep Learning Models in a Browser: Andrej Karpathy Interview// Javascript is just a high level scripting language, 老中 big 5就是迷信洋人. 你老中 自己的土人, 说啥他们也不信. 这些类似的想法, 多次说过. 做起来也费不了多少事. 世界观问题

      US big 5: MSFT, AMZN, GOOG, FB, AAPL

      前面寫過:人類語言是有先天缺陷的.就是人類語言發育在近現代物理數學出生前面去了. 從這個觀點看, 人類實際上大部分都是"文盲", 就是亂讀萬卷書.萬卷書其中很大一部分都是94噪音, 以訛傳訛,然後互相臉紅脖子處吵架 所以我們模型構思的語言支持張量機, 對於人類身心都是也許是革命性的好處

      • 家园 另外一方面: ML=你的个人顾问团,帮你表达清楚你的意思

        类似国家领导人之间谈话,时间有限,问题重大,向对方表达清楚你的立场观点,事先要花纳税人多少钱养一批人专门干这个领导人讲话文工团工作? 对内对外.

        所以目前看,机器学习大概是人类没有办法的办法了。人类目前在生产力和生产关系两个方面进步停滞,说到这些,我的老毛病就又犯了

        • 家园 你思维比较发散

          自己闷屋里大开脑洞没关系,对错都是禽兽无害,走到外面世界中,会吓到一般人的。

          万物都有联系不错,但是不要心急,关系要一点点理顺。维度太高,大脑也不够用的。要有决心放弃大脑,用工具去扩展思维空间。方法论还是要讲一点的。

          • 家园 人文语言的通病(也是创造性)的一方面特点就是"思维发散"

            "思维发散"写好了就是金庸. 我们大多数人都不是金庸, 结果写的就是烂文.

            有个实验总结.机器人写"色文"相对容易, you just need to keep pushing a few buttons. 机器人写"金庸文"就很困难.

            但现实社会生活生产中大多数都不是让你去写"金庸文", then:

            boolean, conditional, iterative, ..

            大多数问题, 这些 operations 就可以先给妳分类,解决掉.

            for example:

            email classifier: spam or ham, SVM classifier can do it;

            但真有人用电邮给你写情书,恐怕你也收不到了, SVM classifier may well throw it out as a spam.

            This is a good discussion, thanks.

            • 家园 "创造性"或破壞性:在人類經常是自我強化的, 就是非線性

              "思维发散"写好了就是金庸, 在這裡得了一大堆花, 那我們就來勁了8?

              反過來我們就要戰天斗地, 捍衛我們自己的宇宙唯一正確, 我們拯救人類的救世主理論.

              這就是個人類經常自我強化的非線性過程.

              但現在這種 internet forum 戰場太多了, 結果就變成了 entropy 放大過程, 沒意思了. 成了自我強化過程的對沖機制, 很類似股票市場.

              機器學習很有搞頭. 但要能夠動手寫至少一兩種語言, such as python, c++.

          • 家园 有这个问题。计算机语言实际是半数学半英文

            是人类社会交流方式的一个进步. 否则大家要互相钻到对方的脑子里,了解对方到底想说啥,目前人类的语言很难做到,不只是效率问题。

            当然计算机语言也不是万能的,人类只能一步一步往前走.

            比如你说的都是比较大的道理,人人都明白,但太明白也许没有很多内容。我说的也许又太具体,而且跨度还很大,我又没有仔细写,写得有不多。更像是写给我自己记笔记,人家读了不知说云,浪费了人家时间。

            类似这种情况显然到处都是,古今中外

    • 家园 微分几何理论: 宏观运动都是可以用微分几何描述和理解

      不考虑量子力学问题.

      就是说, 爱因斯坦广义相对论基础上进一步完善的微分几何理论潜力是很大的, 各个方面, 抱括机器学习. 机器学习显然和人工智能, 人类意识等有关.

      所以人类进步的下一个突破口. 也许和这几条有关系. 这这几条方面人类进步突破了, 对我们常说的所谓人类生产关系的改革和进步, 都会有也许是革命性的意义.

    • 家园 我在新浪微博上寫了不少有關筆記, 想在其他領域開發這個

      賬號"语言智能_機器學習_市場模擬器".

      老美當然有人做"微分几何基础上的SVM", 但也是很少, 各方面原因.微分幾何還是比較陽春白雪, 懂得的人相對少. 就是原因之一.

      "现在的机器学习本质上是物理学的"矢量场", 数学上的矩阵运算, 然后玩一些小样本统计,就是把那些啥传统的统计测度, 大数定理之类的"先验论"给扔掉了。前面写过。矢量场是有坐标系原点选择问题的。所以下一步是支持张量机了,然后你的算法才有可能坐标变换不变,94规范变换不变"

    • 家园 一点小建议

      如果你真想做医疗产品的话

      1,时髦的技术高深的名词拿来争取资金可以。但是千万不要把产品的性能寄托在时髦的技术与高深的名词上。

      2,对医疗产品而言,三个指标:准确性,可重复性,可参照再现性。请牢记这三个指标,并且在你们的研发流程中死扣这三个指标。

      3,技术发展,概念设计,产品研发,请从一开始就准备好详尽的文档记录。对技术研发而言,最重要的是技术完备分级制度以及相应的测试/文档设计编写,对产品研发而言,最重要的是研发关口的过关制度以及相应的测试/文档/查验签字等等的设计编写。

      4,请从一开始就要和该领域走在最前沿的应用专家合作。尽量争取把他们的意见加入到你们的概念中去,用你们的技术/产品来实现他们的相法,建议,并让他们来做为你们的最初始的客户。

      祝你们好运!

      通宝推:刹那芳华,
    • 家园 预测肿瘤如何生长,意义在哪里?

      肿瘤治疗优先选择切除,切除一般都是以切干净并捎带部分正常组织为目的

      预测生长有什么意义吗

      • 家园 "预测肿瘤如何生长"也许对肿瘤未来发展是否恶性有参考
        • 家园 我是做肿瘤发生发展分子机制的

          第一眼,觉得你这个思路很新颖很独特

          不过仔细想想确实想不出具体意义

          能够预测肿瘤如何生长,是不是一定能够提出干预肿瘤生长的手段?即使能,你这个干预也只是往哪里长,长成方的还是圆的,物理上并不能改变生长速度,想让肿瘤不长还得从细胞里面想办法。

          你这个用来研究发育是不是会更有意义一些。比如外伤或者肿瘤切除了半个肝,怎么切可以让剩下半个肝可以更快的恢复成一整个。设计恰当的手术切口让器官缺损的愈合更有效率。

          数学上讲,器官发育过程的形状变化就是拓扑学吧。

          • 家园 最近会见在一个做病理切片图像机器学习公司工作的医生

            有新信息再在这里报告,他原来在一家类似的 start up工作,后来那个公司没钱做下去了, 现在换了一家公司,都在旧金山湾区

分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河