V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  suuuch  ›  全部回复第 5 页 / 共 16 页
回复总数  313
1  2  3  4  5  6  7  8  9  10 ... 16  
357 天前
回复了 haoyu7 创建的主题 程序员 有一台服务器一般都做什么
frp, 梯子, 数据库,爬虫, streamlit page , openai 转发, slack 机器人, 小飞机机器人

大概就这些。。。
不要玩文字游戏。。就国内这几代人可以说是安分守己、遵守各种道德、法律、号召的代表了,结果依旧要为生计奔波。。反而是不遵守的人更有机会。你觉得是啥原因?
主要是户口不在上海,然后想在上海交。貌似小微企业注册和存续一年花不了多少钱?
注册小微企业,自己给自己交,有人现身说法没?
大概几种情况
1. 确实工作太忙
2. 招聘刚放出来,岗位不着急,手上没有更好的,你也有一些缺点,想等等看有没有更好的
3. 招聘刚放出来,岗位不着急,手上有其它候选人,你也有一些缺点,想等其它候选人多面两次再对比决定
4. 招聘刚放出来,岗位可招可不招,想捡漏一个比较厉害的
colab pro 可以先充值一个月试试看,只做推理的话,还是够用的,还可以免得冲动消费。。
我也发表下个人的看法:
在某种意义上来说,各种技术方案、编程语言,都是在应对人。计算机本身并不关心这些二进制的是什么,换言之任何技术方案、编程语言、术语、岗位都是在解决人的问题。

纯粹从技术上去考虑这些,确实是没什么区别的,每种方案都可以完成目标。区别在于这些方案对应的其它成本,比如机器成本,人力成本,时间成本这些显性成本。还有一些隐性成本,比如沟通成本之类的。

数据仓库这些东西,确实就是 收集数据 -> 整理数据 -> 输出数据,这个链路。更抽象点的就是数据的输入和输出。
抽象到这里的时候,所有的程序、系统都可以抽象的理解为 数据的输入和输出。



至于提到的其它问题:

“什么是数据库,什么是数据仓库”:数据库是对应软件系统,数据仓库是一种概念上的,并不对应到具体软件上。

“数据仓库有什么优势”:数据仓库的优势取决于对比系统,业务系统要求高并发,数据仓库要求高吞吐量。

“ELT 和 ETL 的区别”:这两者的区别在于数据处理数据速度和数据传输速度之间的关系,决定采用哪种方案看场景。


“数据治理的好处”:数据治理也是特定场景下的,互联网里面确实不多。传统企业里面多,有些传统企业里面的系统有 dephi ,c#,java 诸多版本,整个建设周期可能比程序员的生命周期都长,各种奇奇怪怪的数据和定义,这种背景下数据治理的好处才能被切身体会出来。
2024-03-10 14:33:42 +08:00
回复了 FerrisChan 创建的主题 职场话题 转安卓 还是继续 pc 开发
试试转游戏呢?
2024-02-27 19:21:22 +08:00
回复了 wt0210 创建的主题 NVIDIA 现在买 4090 是个好时机吗
@L13 前段时间收到推送的,我刚搜了下,发现找不到了。。。
2024-02-27 13:53:16 +08:00
回复了 wt0210 创建的主题 NVIDIA 现在买 4090 是个好时机吗
1. 玩游戏得话,4060ti 差不多大部分游戏可玩。

2. 跑模型得话,B 站上有人买三张 4060ti 跑模型,看参数性能是大于 4090 的。。折衷下,买两张 4060ti 看看行不行。
2024-02-24 08:58:33 +08:00
回复了 Hole 创建的主题 职场话题 怎么从领导的角度看问题?
一般情况下,我的领导在休假期间找我的原因只有一个,更大的老板在找他,他需要我解释一些细节的东西。
在事业单位这种,对财务和流程相关的事情都是优先级特别特别高的,要慎之又慎,这个很容易让人抓住小辫子,这个事情说大了可以往捅到上级部门,小了说内部审计找麻烦都可以。
原因非常简单:未按流程走账目,私企很容易过,国企可不行,一定要去找更上一级报备一下才可以。。
我们这审计曾因为项目提前结束把我们领导拉过去谈话。。


原始帖子我也看了,但是给的信息太少了。。。像有些领导可能一两年之间,就一次或者两次这种在休假期间找你的情况,我不会认为领导有什么问题。。假如是频繁的小题大做,休假或放假各种要求工作的频率比较高,才能说明这个领导有问题。。
2024-02-19 14:52:17 +08:00
回复了 thawne 创建的主题 NAS NAS 求推荐
群晖吧,买之前觉得贵,买之后觉得挺好用的。

要高性能的话,就自己再组个台式机跑其它的。
2024-02-11 19:00:53 +08:00
回复了 FlyingBackscratc 创建的主题 程序员 各位,大数据入门应该从什么地方开始下手?
@FlyingBackscratc 安装 hive 的前置条件是安装好 hdfs ,据我所知是没办法直接 docker 部署的。
2024-02-07 13:55:13 +08:00
回复了 FlyingBackscratc 创建的主题 程序员 各位,大数据入门应该从什么地方开始下手?
hadoop 是个计算框架,里面东西很多,一般都是集群安装。
里面最主要包含 MapReduce 和 HDFS 。
HDFS 是分布式文件系统,MR 是计算框架。
HIVE 是一个类 SQL 的查询引擎,查询 HDFS 里面的数据。底层计算引擎默认是 MR 的,可以改成 tez ,spark 之类的计算引擎。
SPRARK 是计算引擎,用的 RDD 概念实现的。


性能的话,粗暴点估算,3 台 CPU *2 , 内存 128G *2 的服务器,算是起始配置。低于这个配置,找列存储数据库做 OLAP 系统即可。比如 clickhouse ,greenplum 之类的,数据同步 直接 kettle 就行。
还有其它一些基于 PostgreSQL 的数据库,在 OLAP 领域都不错。

没必要纠结。。上了 hadoop 涉及的到程序本身的性能和运维人员的能力要求都会高很多,并不是那么容易直接上去的。
2024-02-07 13:25:32 +08:00
回复了 suuuch 创建的主题 Kubernetes 自建低成本集群(k8s, Spark)的方式有哪些?
@ironboxplus 这个方案我试过,网络延迟是挑战。我用的 talscale 没成功,能看到机器,但是无法联通。我就继续使用我之前用的 zerotier 了
1  2  3  4  5  6  7  8  9  10 ... 16  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3253 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 12:29 · PVG 20:29 · LAX 05:29 · JFK 08:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.