FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6211, 201 aa 1>>>pF1KE6211 201 - 201 aa - 201 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6426+/-0.00102; mu= 11.8799+/- 0.061 mean_var=90.5809+/-18.220, 0's: 0 Z-trim(105.5): 105 B-trim: 5 in 1/50 Lambda= 0.134758 statistics sampled from 8326 (8438) to 8326 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.259), width: 16 Scan time: 2.010 The best scores are: opt bits E(32554) CCDS4864.1 GUCA1A gene_id:2978|Hs108|chr6 ( 201) 1323 267.2 4.9e-72 CCDS2954.1 GUCA1C gene_id:9626|Hs108|chr3 ( 209) 661 138.5 2.8e-33 CCDS4865.1 GUCA1B gene_id:2979|Hs108|chr6 ( 200) 559 118.6 2.5e-27 CCDS1671.1 HPCAL1 gene_id:3241|Hs108|chr2 ( 193) 490 105.2 2.7e-23 CCDS6292.1 NCALD gene_id:83988|Hs108|chr8 ( 193) 480 103.3 1e-22 CCDS370.1 HPCA gene_id:3208|Hs108|chr1 ( 193) 474 102.1 2.3e-22 CCDS1689.1 VSNL1 gene_id:7447|Hs108|chr2 ( 191) 427 93.0 1.3e-19 CCDS441.1 HPCAL4 gene_id:51440|Hs108|chr1 ( 191) 413 90.2 8.6e-19 CCDS78448.1 NCS1 gene_id:23413|Hs108|chr9 ( 172) 412 90.0 9.1e-19 CCDS6932.1 NCS1 gene_id:23413|Hs108|chr9 ( 190) 411 89.8 1.1e-18 CCDS11151.1 RCVRN gene_id:5957|Hs108|chr17 ( 200) 384 84.6 4.4e-17 CCDS7524.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 220) 369 81.7 3.6e-16 CCDS7525.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 225) 369 81.7 3.7e-16 CCDS41562.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 252) 369 81.8 4e-16 CCDS7522.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 270) 369 81.8 4.2e-16 CCDS7521.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 285) 369 81.8 4.4e-16 CCDS64313.1 KCNIP1 gene_id:30820|Hs108|chr5 ( 188) 358 79.5 1.4e-15 CCDS4374.1 KCNIP1 gene_id:30820|Hs108|chr5 ( 216) 358 79.6 1.6e-15 CCDS34285.1 KCNIP1 gene_id:30820|Hs108|chr5 ( 225) 358 79.6 1.6e-15 CCDS34286.1 KCNIP1 gene_id:30820|Hs108|chr5 ( 227) 358 79.6 1.6e-15 CCDS7523.1 KCNIP2 gene_id:30819|Hs108|chr10 ( 227) 352 78.4 3.6e-15 CCDS47035.1 KCNIP4 gene_id:80333|Hs108|chr4 ( 188) 348 77.6 5.4e-15 CCDS43215.1 KCNIP4 gene_id:80333|Hs108|chr4 ( 216) 348 77.6 6e-15 CCDS43217.1 KCNIP4 gene_id:80333|Hs108|chr4 ( 225) 348 77.7 6.2e-15 CCDS3428.1 KCNIP4 gene_id:80333|Hs108|chr4 ( 229) 348 77.7 6.3e-15 CCDS43216.1 KCNIP4 gene_id:80333|Hs108|chr4 ( 250) 348 77.7 6.7e-15 CCDS33245.1 KCNIP3 gene_id:30818|Hs108|chr2 ( 230) 332 74.5 5.5e-14 CCDS2013.1 KCNIP3 gene_id:30818|Hs108|chr2 ( 256) 332 74.6 5.9e-14 CCDS64312.1 KCNIP1 gene_id:30820|Hs108|chr5 ( 241) 303 68.9 2.8e-12 >>CCDS4864.1 GUCA1A gene_id:2978|Hs108|chr6 (201 aa) initn: 1323 init1: 1323 opt: 1323 Z-score: 1406.7 bits: 267.2 E(32554): 4.9e-72 Smith-Waterman score: 1323; 100.0% identity (100.0% similar) in 201 aa overlap (1-201:1-201) 10 20 30 40 50 60 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSPSASQYVEQMF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSPSASQYVEQMF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 ETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDRDELLTIIQAIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 ETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDRDELLTIIQAIR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 AINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQMLLDTLTRSLDLTRIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 AINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQMLLDTLTRSLDLTRIV 130 140 150 160 170 180 190 200 pF1KE6 RRLQNGEQDEEGADEAAEAAG ::::::::::::::::::::: CCDS48 RRLQNGEQDEEGADEAAEAAG 190 200 >>CCDS2954.1 GUCA1C gene_id:9626|Hs108|chr3 (209 aa) initn: 668 init1: 445 opt: 661 Z-score: 710.9 bits: 138.5 E(32554): 2.8e-33 Smith-Waterman score: 661; 46.4% identity (78.7% similar) in 207 aa overlap (1-201:1-202) 10 20 30 40 50 pF1KE6 MGNVMEGKSV----EELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSPSASQYV ::: :::. . . . : : ::. :: : ::: ::.::. ..::..:. .:.... CCDS29 MGN---GKSIAGDQKAVPTQETHVWYRTFMMEYPSGLQTLHEFKTLLGLQGLNQKANKHI 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 EQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDRDELLTII .:...::: ::::..::.:..::..:... :.::::.:::::::.:::: ::..::: .. CCDS29 DQVYNTFDTNKDGFVDFLEFIAAVNLIMQEKMEQKLKWYFKLYDADGNGSIDKNELLDMF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 QAIRAINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQMLLDTLTRSLDL .:..:.: .. :.. ::: . :: :::.:.::::.:::::.:. ::: ::. . .:.:. CCDS29 MAVQALN--GQQTLSPEEFINLVFHKIDINNDGELTLEEFINGMAKDQDLLEIVYKSFDF 120 130 140 150 160 170 180 190 200 pF1KE6 TRIVRRLQNGEQDEEGAD--EAAEAAG . ..: . ::.: . .: .. . :: CCDS29 SNVLRVICNGKQPDMETDSSKSPDKAGLGKVKMK 180 190 200 >>CCDS4865.1 GUCA1B gene_id:2979|Hs108|chr6 (200 aa) initn: 563 init1: 312 opt: 559 Z-score: 604.0 bits: 118.6 E(32554): 2.5e-27 Smith-Waterman score: 559; 47.2% identity (75.3% similar) in 178 aa overlap (6-175:9-185) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSPSASQYVE :.... :.. .: ..:::::. ::::: : ..::..:: . . . :::::: CCDS48 MGQEFSWEEAEAAGEIDVAELQEWYKKFVMECPSGTLFMHEFKRFFKVTD-DEEASQYVE 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 QMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDRDELLTIIQ ::..:: : :. :::.::::::.:::.: .:.::.: ::.:: :::::::: :::.:.. CCDS48 GMFRAFDKNGDNTIDFLEYVAALNLVLRGTLEHKLKWTFKIYDKDGNGCIDRLELLNIVE 60 70 80 90 100 110 120 130 140 150 160 pF1KE6 AI--------RAINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQMLLDT .: : .. . .: :: .: .: .: ::::.:::.::.::...:. .. CCDS48 GIYQLKKACRRELQTEQGQLLTPEEVVDRIFLLVDENGDGQLSLNEFVEGARRDKWVMKM 120 130 140 150 160 170 170 180 190 200 pF1KE6 LTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG : ... CCDS48 LQMDMNPSSWLAQQRRKSAMF 180 190 200 >>CCDS1671.1 HPCAL1 gene_id:3241|Hs108|chr2 (193 aa) initn: 483 init1: 378 opt: 490 Z-score: 531.7 bits: 105.2 E(32554): 2.7e-23 Smith-Waterman score: 490; 44.2% identity (76.4% similar) in 165 aa overlap (12-170:21-183) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP- :... : ..::: :. .::.:.::. ::..... :. : CCDS16 MGKQNSKLRPEVLQDLRENTEFTDHELQEWYKGFLKDCPTGHLTVDEFKKIYA--NFFPY 10 20 30 40 50 60 70 80 90 100 pF1KE6 -SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDR .::...:..:.::: : :: ::: :.. :::.. .::.::::.: :..::.:::: :.: CCDS16 GDASKFAEHVFRTFDTNGDGTIDFREFIIALSVTSRGKLEQKLKWAFSMYDLDGNGYISR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 DELLTIIQAIR----AINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQM .:.: :.::: .. . : :. :: .: ..:.:.::.:::::::.:...: CCDS16 SEMLEIVQAIYKMVSSVMKMPEDESTPEKRTDKIFRQMDTNNDGKLSLEEFIRGAKSDPS 120 130 140 150 160 170 170 180 190 200 pF1KE6 LLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG .. : CCDS16 IVRLLQCDPSSASQF 180 190 >>CCDS6292.1 NCALD gene_id:83988|Hs108|chr8 (193 aa) initn: 440 init1: 377 opt: 480 Z-score: 521.2 bits: 103.3 E(32554): 1e-22 Smith-Waterman score: 480; 43.0% identity (74.5% similar) in 165 aa overlap (12-170:21-183) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP- ... : ..::: :. .::::.:.. ::....: :. : CCDS62 MGKQNSKLRPEVMQDLLESTDFTEHEIQEWYKGFLRDCPSGHLSMEEFKKIYG--NFFPY 10 20 30 40 50 60 70 80 90 100 pF1KE6 -SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDR .::...:..:.::: : :: ::: :.. :::.. .::.::::.: :..::.:::: :.. CCDS62 GDASKFAEHVFRTFDANGDGTIDFREFIIALSVTSRGKLEQKLKWAFSMYDLDGNGYISK 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 DELLTIIQAIR----AINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQM :.: :.::: .. . : :. :. .: ..:.: ::.:::::::.:...: CCDS62 AEMLEIVQAIYKMVSSVMKMPEDESTPEKRTEKIFRQMDTNRDGKLSLEEFIRGAKSDPS 120 130 140 150 160 170 170 180 190 200 pF1KE6 LLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG .. : CCDS62 IVRLLQCDPSSAGQF 180 190 >>CCDS370.1 HPCA gene_id:3208|Hs108|chr1 (193 aa) initn: 431 init1: 368 opt: 474 Z-score: 514.9 bits: 102.1 E(32554): 2.3e-22 Smith-Waterman score: 474; 43.0% identity (75.2% similar) in 165 aa overlap (12-170:21-183) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP- :.: : ..::: :. .::.: :.. ::..... :. : CCDS37 MGKQNSKLRPEMLQDLRENTEFSELELQEWYKGFLKDCPTGILNVDEFKKIYA--NFFPY 10 20 30 40 50 60 70 80 90 100 pF1KE6 -SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDR .::...:..:.::: :.:: ::: :.. :::.. .:..:::: : :..::.:::: :.: CCDS37 GDASKFAEHVFRTFDTNSDGTIDFREFIIALSVTSRGRLEQKLMWAFSMYDLDGNGYISR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 DELLTIIQAIR----AINPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQM .:.: :.::: .. . : :. :. .: ..:.:.::.:::::::.:...: CCDS37 EEMLEIVQAIYKMVSSVMKMPEDESTPEKRTEKIFRQMDTNNDGKLSLEEFIRGAKSDPS 120 130 140 150 160 170 170 180 190 200 pF1KE6 LLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG .. : CCDS37 IVRLLQCDPSSASQF 180 190 >>CCDS1689.1 VSNL1 gene_id:7447|Hs108|chr2 (191 aa) initn: 415 init1: 351 opt: 427 Z-score: 465.6 bits: 93.0 E(32554): 1.3e-19 Smith-Waterman score: 427; 42.4% identity (70.6% similar) in 170 aa overlap (4-163:12-178) 10 20 30 40 50 pF1KE6 MGNVMEG--KSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP ::: ::.: .. : .:::: :. .::::.:.: ::.:.. .. : CCDS16 MGKQNSKLAPEVMEDLVKSTE-FNEHELKQWYKGFLKDCPSGRLNLEEFQQLY--VKFFP 10 20 30 40 50 60 70 80 90 100 pF1KE6 --SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCID .::..... :.::: : :: ::: :.. :::.. .:. :::: : :..::.::.: : CCDS16 YGDASKFAQHAFRTFDKNGDGTIDFREFICALSITSRGSFEQKLNWAFNMYDLDGDGKIT 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 RDELLTIIQAIRAI------NPCSDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQK : :.: ::.:: . .. .: :. .: .:::.: : : ...:.:: :.... CCDS16 RVEMLEIIEAIYKMVGTVIMMKMNEDGLTPEQRVDKIFSKMDKNKDDQITLDEFKEAAKS 120 130 140 150 160 170 170 180 190 200 pF1KE6 DQMLLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG : CCDS16 DPSIVLLLQCDIQK 180 190 >>CCDS441.1 HPCAL4 gene_id:51440|Hs108|chr1 (191 aa) initn: 375 init1: 351 opt: 413 Z-score: 450.8 bits: 90.2 E(32554): 8.6e-19 Smith-Waterman score: 413; 41.9% identity (71.2% similar) in 160 aa overlap (12-163:21-178) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP- :.: : .:::: :. .:::: :.: ::.:.. .: . : CCDS44 MGKTNSKLAPEVLEDLVQNTEFSEQELKQWYKGFLKDCPSGILNLEEFQQLY-IK-FFPY 10 20 30 40 50 60 70 80 90 100 pF1KE6 -SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDR .::..... :.::: : :: ::: :.. :::.. .:. :::: : :..::.::.: : : CCDS44 GDASKFAQHAFRTFDKNGDGTIDFREFICALSVTSRGSFEQKLNWAFEMYDLDGDGRITR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 DELLTIIQAIRAINPC------SDTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKD :.: ::.:: . .. .: .. .: .:.:.: . : ...:::: :....: CCDS44 LEMLEIIEAIYKMVGTVIMMRMNQDGLTPQQRVDKIFKKMDQDKDDQITLEEFKEAAKSD 120 130 140 150 160 170 170 180 190 200 pF1KE6 QMLLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG CCDS44 PSIVLLLQCDMQK 180 190 >>CCDS78448.1 NCS1 gene_id:23413|Hs108|chr9 (172 aa) initn: 376 init1: 320 opt: 412 Z-score: 450.4 bits: 90.0 E(32554): 9.1e-19 Smith-Waterman score: 412; 38.2% identity (70.3% similar) in 165 aa overlap (13-171:4-166) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP--SASQYVEQ .. : .:::: :. .:::::: :.... :.. : . .... CCDS78 MATITEKEVQQWYKGFIKDCPSGQLDAAGFQKIY--KQFFPFGDPTKFATF 10 20 30 40 60 70 80 90 100 110 pF1KE6 MFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDRDELLTIIQA .:..:: :::: :.: :.. :::.. .: ...:::: :::::.:..: : :.:.: :..: CCDS78 VFNVFDENKDGRIEFSEFIQALSVTSRGTLDEKLRWAFKLYDLDNDGYITRNEMLDIVDA 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE6 IRAINPCS----DTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQMLLDTLTRSL : . . . : :. .: .:. .: :.::.:.:.:: :: . : ....:. CCDS78 IYQMVGNTVELPEEENTPEKRVDRIFAMMDKNADGKLTLQEFQEGSKADPSIVQALSLYD 110 120 130 140 150 160 180 190 200 pF1KE6 DLTRIVRRLQNGEQDEEGADEAAEAAG CCDS78 GLV 170 >>CCDS6932.1 NCS1 gene_id:23413|Hs108|chr9 (190 aa) initn: 375 init1: 319 opt: 411 Z-score: 448.8 bits: 89.8 E(32554): 1.1e-18 Smith-Waterman score: 411; 38.2% identity (70.3% similar) in 165 aa overlap (13-171:22-184) 10 20 30 40 50 pF1KE6 MGNVMEGKSVEELSSTECHQWYKKFMTECPSGQLTLYEFRQFFGLKNLSP- .. : .:::: :. .:::::: :.... :.. : CCDS69 MGKSNSKLKPEVVEELTRKTYFTEKEVQQWYKGFIKDCPSGQLDAAGFQKIY--KQFFPF 10 20 30 40 50 60 70 80 90 100 pF1KE6 -SASQYVEQMFETFDFNKDGYIDFMEYVAALSLVLKGKVEQKLRWYFKLYDVDGNGCIDR . .... .:..:: :::: :.: :.. :::.. .: ...:::: :::::.:..: : : CCDS69 GDPTKFATFVFNVFDENKDGRIEFSEFIQALSVTSRGTLDEKLRWAFKLYDLDNDGYITR 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 DELLTIIQAIRAINPCS----DTTMTAEEFTDTVFSKIDVNGDGELSLEEFIEGVQKDQM .:.: :..:: . . . : :. .: .:. .: :.::.:.:.:: :: . : CCDS69 NEMLDIVDAIYQMVGNTVELPEEENTPEKRVDRIFAMMDKNADGKLTLQEFQEGSKADPS 120 130 140 150 160 170 170 180 190 200 pF1KE6 LLDTLTRSLDLTRIVRRLQNGEQDEEGADEAAEAAG ....:. CCDS69 IVQALSLYDGLV 180 190 201 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:07:30 2016 done: Tue Nov 8 11:07:31 2016 Total Scan time: 2.010 Total Display time: -0.020 Function used was FASTA [36.3.4 Apr, 2011]